layers/sync/sync_op.cpp - third_party/Vulkan-ValidationLayers - Git at Google

 /*
  * Copyright (c) 2019-2024 Valve Corporation
  * Copyright (c) 2019-2024 LunarG, Inc.
  *
  * Licensed under the Apache License, Version 2.0 (the "License");
  * you may not use this file except in compliance with the License.
  * You may obtain a copy of the License at
  *
  *     http://www.apache.org/licenses/LICENSE-2.0
  *
  * Unless required by applicable law or agreed to in writing, software
  * distributed under the License is distributed on an "AS IS" BASIS,
  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  * See the License for the specific language governing permissions and
  * limitations under the License.
  */

 #include "sync/sync_op.h"
 #include "sync/sync_renderpass.h"
 #include "sync/sync_access_context.h"
 #include "sync/sync_commandbuffer.h"
 #include "sync/sync_image.h"

 #include "state_tracker/buffer_state.h"
 #include "state_tracker/cmd_buffer_state.h"
 #include "state_tracker/render_pass_state.h"

 #include "sync/sync_validation.h"

 // Range generators for to allow event scope filtration to be limited to the top of the resource access traversal pipeline
 //
 // Note: there is no "begin/end" or reset facility.  These are each written as "one time through" generators.
 //
 // Usage:
 //  Constructor() -- initializes the generator to point to the begin of the space declared.
 //  *  -- the current range of the generator empty signfies end
 //  ++ -- advance to the next non-empty range (or end)

 // Generate the ranges that are the intersection of range and the entries in the RangeMap
 template <typename RangeMap, typename KeyType = typename RangeMap::key_type>
 class MapRangesRangeGenerator {
   public:
     // Default constructed is safe to dereference for "empty" test, but for no other operation.
     MapRangesRangeGenerator() : range_(), map_(nullptr), map_pos_(), current_() {
         // Default construction for KeyType *must* be empty range
         assert(current_.empty());
     }
     MapRangesRangeGenerator(const RangeMap &filter, const KeyType &range) : range_(range), map_(&filter), map_pos_(), current_() {
         SeekBegin();
     }
     MapRangesRangeGenerator(const MapRangesRangeGenerator &from) = default;

     const KeyType &operator*() const { return current_; }
     const KeyType *operator->() const { return &current_; }
     MapRangesRangeGenerator &operator++() {
         ++map_pos_;
         UpdateCurrent();
         return *this;
     }

     bool operator==(const MapRangesRangeGenerator &other) const { return current_ == other.current_; }

   protected:
     void UpdateCurrent() {
         if (map_pos_ != map_->cend()) {
             current_ = range_ & map_pos_->first;
         } else {
             current_ = KeyType();
         }
     }
     void SeekBegin() {
         map_pos_ = map_->lower_bound(range_);
         UpdateCurrent();
     }

     // Adding this functionality here, to avoid gratuitous Base:: qualifiers in the derived class
     // Note: Not exposed in this classes public interface to encourage using a consistent ++/empty generator semantic
     template <typename Pred>
     MapRangesRangeGenerator &PredicatedIncrement(Pred &pred) {
         do {
             ++map_pos_;
         } while (map_pos_ != map_->cend() && map_pos_->first.intersects(range_) && !pred(map_pos_));
         UpdateCurrent();
         return *this;
     }

     const KeyType range_;
     const RangeMap *map_;
     typename RangeMap::const_iterator map_pos_;
     KeyType current_;
 };
 using EventSimpleRangeGenerator = MapRangesRangeGenerator<AccessContext::ScopeMap>;

 // Generate the ranges that are the intersection of the RangeGen ranges and the entries in the FilterMap
 // Templated to allow for different Range generators or map sources...
 template <typename RangeMap, typename RangeGen, typename KeyType = typename RangeMap::key_type>
 class FilteredGeneratorGenerator {
   public:
     // Default constructed is safe to dereference for "empty" test, but for no other operation.
     FilteredGeneratorGenerator() : filter_(nullptr), gen_(), filter_pos_(), current_() {
         // Default construction for KeyType *must* be empty range
         assert(current_.empty());
     }
     FilteredGeneratorGenerator(const RangeMap &filter, RangeGen &gen) : filter_(&filter), gen_(gen), filter_pos_(), current_() {
         SeekBegin();
     }
     FilteredGeneratorGenerator(const FilteredGeneratorGenerator &from) = default;
     const KeyType &operator*() const { return current_; }
     const KeyType *operator->() const { return &current_; }
     FilteredGeneratorGenerator &operator++() {
         KeyType gen_range = GenRange();
         KeyType filter_range = FilterRange();
         current_ = KeyType();
         while (gen_range.non_empty() && filter_range.non_empty() && current_.empty()) {
             if (gen_range.end > filter_range.end) {
                 // if the generated range is beyond the filter_range, advance the filter range
                 filter_range = AdvanceFilter();
             } else {
                 gen_range = AdvanceGen();
             }
             current_ = gen_range & filter_range;
         }
         return *this;
     }

     bool operator==(const FilteredGeneratorGenerator &other) const { return current_ == other.current_; }

   private:
     KeyType AdvanceFilter() {
         ++filter_pos_;
         auto filter_range = FilterRange();
         if (filter_range.valid()) {
             FastForwardGen(filter_range);
         }
         return filter_range;
     }
     KeyType AdvanceGen() {
         ++gen_;
         auto gen_range = GenRange();
         if (gen_range.valid()) {
             FastForwardFilter(gen_range);
         }
         return gen_range;
     }

     KeyType FilterRange() const { return (filter_pos_ != filter_->cend()) ? filter_pos_->first : KeyType(); }
     KeyType GenRange() const { return *gen_; }

     KeyType FastForwardFilter(const KeyType &range) {
         auto filter_range = FilterRange();
         int retry_count = 0;
         const static int kRetryLimit = 2;  // TODO -- determine whether this limit is optimal
         while (!filter_range.empty() && (filter_range.end <= range.begin)) {
             if (retry_count < kRetryLimit) {
                 ++filter_pos_;
                 filter_range = FilterRange();
                 retry_count++;
             } else {
                 // Okay we've tried walking, do a seek.
                 filter_pos_ = filter_->lower_bound(range);
                 break;
             }
         }
         return FilterRange();
     }

     // TODO: Consider adding "seek" (or an absolute bound "get" to range generators to make this walk
     // faster.
     KeyType FastForwardGen(const KeyType &range) {
         auto gen_range = GenRange();
         while (!gen_range.empty() && (gen_range.end <= range.begin)) {
             ++gen_;
             gen_range = GenRange();
         }
         return gen_range;
     }

     void SeekBegin() {
         auto gen_range = GenRange();
         if (gen_range.empty()) {
             current_ = KeyType();
             filter_pos_ = filter_->cend();
         } else {
             filter_pos_ = filter_->lower_bound(gen_range);
             current_ = gen_range & FilterRange();
         }
     }

     const RangeMap *filter_;
     RangeGen gen_;
     typename RangeMap::const_iterator filter_pos_;
     KeyType current_;
 };

 using EventImageRangeGenerator = FilteredGeneratorGenerator<AccessContext::ScopeMap, subresource_adapter::ImageRangeGenerator>;

 SyncOpBarriers::SyncOpBarriers(vvl::Func command, const SyncValidator &sync_state, VkQueueFlags queue_flags,
                                VkPipelineStageFlags srcStageMask, VkPipelineStageFlags dstStageMask,
                                VkDependencyFlags dependencyFlags, uint32_t memoryBarrierCount,
                                const VkMemoryBarrier *pMemoryBarriers, uint32_t bufferMemoryBarrierCount,
                                const VkBufferMemoryBarrier *pBufferMemoryBarriers, uint32_t imageMemoryBarrierCount,
                                const VkImageMemoryBarrier *pImageMemoryBarriers)
     : SyncOpBase(command), barriers_(1) {
     auto &barrier_set = barriers_[0];
     barrier_set.dependency_flags = dependencyFlags;
     barrier_set.src_exec_scope = SyncExecScope::MakeSrc(queue_flags, srcStageMask);
     barrier_set.dst_exec_scope = SyncExecScope::MakeDst(queue_flags, dstStageMask);
     // Translate the API parameters into structures SyncVal understands directly, and dehandle for safer/faster replay.
     barrier_set.MakeMemoryBarriers(barrier_set.src_exec_scope, barrier_set.dst_exec_scope, dependencyFlags, memoryBarrierCount,
                                    pMemoryBarriers);
     barrier_set.MakeBufferMemoryBarriers(sync_state, barrier_set.src_exec_scope, barrier_set.dst_exec_scope, dependencyFlags,
                                          bufferMemoryBarrierCount, pBufferMemoryBarriers);
     barrier_set.MakeImageMemoryBarriers(sync_state, barrier_set.src_exec_scope, barrier_set.dst_exec_scope, dependencyFlags,
                                         imageMemoryBarrierCount, pImageMemoryBarriers);
 }

 SyncOpBarriers::SyncOpBarriers(vvl::Func command, const SyncValidator &sync_state, VkQueueFlags queue_flags, uint32_t event_count,
                                const VkDependencyInfo *dep_infos)
     : SyncOpBase(command), barriers_(event_count) {
     for (uint32_t i = 0; i < event_count; i++) {
         const auto &dep_info = dep_infos[i];
         auto &barrier_set = barriers_[i];
         barrier_set.dependency_flags = dep_info.dependencyFlags;
         auto stage_masks = sync_utils::GetGlobalStageMasks(dep_info);
         barrier_set.src_exec_scope = SyncExecScope::MakeSrc(queue_flags, stage_masks.src);
         barrier_set.dst_exec_scope = SyncExecScope::MakeDst(queue_flags, stage_masks.dst);
         // Translate the API parameters into structures SyncVal understands directly, and dehandle for safer/faster replay.
         barrier_set.MakeMemoryBarriers(queue_flags, dep_info.dependencyFlags, dep_info.memoryBarrierCount,
                                        dep_info.pMemoryBarriers);
         barrier_set.MakeBufferMemoryBarriers(sync_state, queue_flags, dep_info.dependencyFlags, dep_info.bufferMemoryBarrierCount,
                                              dep_info.pBufferMemoryBarriers);
         barrier_set.MakeImageMemoryBarriers(sync_state, queue_flags, dep_info.dependencyFlags, dep_info.imageMemoryBarrierCount,
                                             dep_info.pImageMemoryBarriers);
     }
 }

 SyncOpPipelineBarrier::SyncOpPipelineBarrier(vvl::Func command, const SyncValidator &sync_state, VkQueueFlags queue_flags,
                                              VkPipelineStageFlags srcStageMask, VkPipelineStageFlags dstStageMask,
                                              VkDependencyFlags dependencyFlags, uint32_t memoryBarrierCount,
                                              const VkMemoryBarrier *pMemoryBarriers, uint32_t bufferMemoryBarrierCount,
                                              const VkBufferMemoryBarrier *pBufferMemoryBarriers, uint32_t imageMemoryBarrierCount,
                                              const VkImageMemoryBarrier *pImageMemoryBarriers)
     : SyncOpBarriers(command, sync_state, queue_flags, srcStageMask, dstStageMask, dependencyFlags, memoryBarrierCount,
                      pMemoryBarriers, bufferMemoryBarrierCount, pBufferMemoryBarriers, imageMemoryBarrierCount,
                      pImageMemoryBarriers) {}

 SyncOpPipelineBarrier::SyncOpPipelineBarrier(vvl::Func command, const SyncValidator &sync_state, VkQueueFlags queue_flags,
                                              const VkDependencyInfo &dep_info)
     : SyncOpBarriers(command, sync_state, queue_flags, 1, &dep_info) {}

 bool SyncOpPipelineBarrier::Validate(const CommandBufferAccessContext &cb_context) const {
     bool skip = false;
     const auto *context = cb_context.GetCurrentAccessContext();
     assert(context);
     if (!context) return skip;
     assert(barriers_.size() == 1);  // PipelineBarriers only support a single barrier set.

     auto detect_image_barrier_hazard = [context](const SyncImageMemoryBarrier &image_barrier) {
         return context->DetectImageBarrierHazard(*image_barrier.image.get(), image_barrier.barrier.src_exec_scope.exec_scope,
                                                  image_barrier.barrier.src_access_scope, image_barrier.range,
                                                  AccessContext::kDetectAll);
     };

     // Validate Image Layout transitions
     const auto &barrier_set = barriers_[0];
     for (const auto &image_barrier : barrier_set.image_memory_barriers) {
         if (image_barrier.new_layout == image_barrier.old_layout) continue;  // Only interested in layout transitions at this point.
         const auto *image_state = image_barrier.image.get();
         if (!image_state) continue;
         const auto hazard = detect_image_barrier_hazard(image_barrier);
         if (hazard.IsHazard()) {
             // PHASE1 TODO -- add tag information to log msg when useful.
             const Location loc(command_);
             const auto &sync_state = cb_context.GetSyncState();
             const auto error =
                 sync_state.error_messages_.PipelineBarrierError(hazard, cb_context, image_barrier.index, *image_state);
             skip |= sync_state.SyncError(hazard.Hazard(), image_state->Handle(), loc, error);
         }
     }
     return skip;
 }

 struct SyncOpPipelineBarrierFunctorFactory {
     using BarrierOpFunctor = PipelineBarrierOp;
     using ApplyFunctor = ApplyBarrierFunctor<BarrierOpFunctor>;
     using GlobalBarrierOpFunctor = PipelineBarrierOp;
     using GlobalApplyFunctor = ApplyBarrierOpsFunctor<GlobalBarrierOpFunctor>;
     using BufferRange = SingleRangeGenerator<ResourceAccessRange>;
     using ImageRange = subresource_adapter::ImageRangeGenerator;
     using GlobalRange = SingleRangeGenerator<ResourceAccessRange>;
     using ImageState = syncval_state::ImageState;

     ApplyFunctor MakeApplyFunctor(QueueId queue_id, const SyncBarrier &barrier, bool layout_transition) const {
         return ApplyFunctor(BarrierOpFunctor(queue_id, barrier, layout_transition));
     }
     GlobalApplyFunctor MakeGlobalApplyFunctor(size_t size_hint, ResourceUsageTag tag) const {
         return GlobalApplyFunctor(true /* resolve */, size_hint, tag);
     }
     GlobalBarrierOpFunctor MakeGlobalBarrierOpFunctor(QueueId queue_id, const SyncBarrier &barrier) const {
         return GlobalBarrierOpFunctor(queue_id, barrier, false);
     }

     BufferRange MakeRangeGen(const vvl::Buffer &buffer, const ResourceAccessRange &range) const {
         if (!SimpleBinding(buffer)) return ResourceAccessRange();
         const auto base_address = ResourceBaseAddress(buffer);
         return (range + base_address);
     }
     ImageRange MakeRangeGen(const ImageState &image, const VkImageSubresourceRange &subresource_range) const {
         return image.MakeImageRangeGen(subresource_range, false);
     }
     GlobalRange MakeGlobalRangeGen() const { return kFullRange; }
 };

 template <typename Barriers, typename FunctorFactory>
 void SyncOpBarriers::ApplyBarriers(const Barriers &barriers, const FunctorFactory &factory, const QueueId queue_id,
                                    const ResourceUsageTag tag, AccessContext *access_context) {
     for (const auto &barrier : barriers) {
         const auto *state = barrier.GetState();
         if (state) {
             auto update_action = factory.MakeApplyFunctor(queue_id, barrier.barrier, barrier.IsLayoutTransition());
             auto range_gen = factory.MakeRangeGen(*state, barrier.Range());
             access_context->UpdateMemoryAccessState(update_action, range_gen);
         }
     }
 }

 template <typename Barriers, typename FunctorFactory>
 void SyncOpBarriers::ApplyGlobalBarriers(const Barriers &barriers, const FunctorFactory &factory, const QueueId queue_id,
                                          const ResourceUsageTag tag, AccessContext *access_context) {
     auto barriers_functor = factory.MakeGlobalApplyFunctor(barriers.size(), tag);
     for (const auto &barrier : barriers) {
         barriers_functor.EmplaceBack(factory.MakeGlobalBarrierOpFunctor(queue_id, barrier));
     }
     auto range_gen = factory.MakeGlobalRangeGen();
     access_context->UpdateMemoryAccessState(barriers_functor, range_gen);
 }

 ResourceUsageTag SyncOpPipelineBarrier::Record(CommandBufferAccessContext *cb_context) {
     const auto tag = cb_context->NextCommandTag(command_);
     for (const auto &barrier_set : barriers_) {
         for (const auto &buffer_barrier : barrier_set.buffer_memory_barriers) {
             cb_context->AddCommandHandle(tag, buffer_barrier.buffer->Handle());
         }
         for (const auto &image_barrier : barrier_set.image_memory_barriers) {
             cb_context->AddCommandHandle(tag, image_barrier.image->Handle());
         }
     }
     ReplayRecord(*cb_context, tag);
     return tag;
 }

 void SyncOpPipelineBarrier::ReplayRecord(CommandExecutionContext &exec_context, const ResourceUsageTag exec_tag) const {
     SyncOpPipelineBarrierFunctorFactory factory;
     // Pipeline barriers only have a single barrier set, unlike WaitEvents2
     assert(barriers_.size() == 1);
     const auto &barrier_set = barriers_[0];
     if (!exec_context.ValidForSyncOps()) return;

     SyncEventsContext *events_context = exec_context.GetCurrentEventsContext();
     AccessContext *access_context = exec_context.GetCurrentAccessContext();
     const auto queue_id = exec_context.GetQueueId();
     ApplyBarriers(barrier_set.buffer_memory_barriers, factory, queue_id, exec_tag, access_context);
     ApplyBarriers(barrier_set.image_memory_barriers, factory, queue_id, exec_tag, access_context);
     ApplyGlobalBarriers(barrier_set.memory_barriers, factory, queue_id, exec_tag, access_context);
     if (barrier_set.single_exec_scope) {
         events_context->ApplyBarrier(barrier_set.src_exec_scope, barrier_set.dst_exec_scope, exec_tag);
     } else {
         for (const auto &barrier : barrier_set.memory_barriers) {
             events_context->ApplyBarrier(barrier.src_exec_scope, barrier.dst_exec_scope, exec_tag);
         }
     }
 }

 bool SyncOpPipelineBarrier::ReplayValidate(ReplayState &replay, ResourceUsageTag recorded_tag) const {
     // The layout transitions happen at the replay tag
     ResourceUsageRange first_use_range = {recorded_tag, recorded_tag + 1};
     return replay.DetectFirstUseHazard(first_use_range);
 }

 void SyncOpBarriers::BarrierSet::MakeMemoryBarriers(const SyncExecScope &src, const SyncExecScope &dst,
                                                     VkDependencyFlags dependency_flags, uint32_t memory_barrier_count,
                                                     const VkMemoryBarrier *barriers) {
     memory_barriers.reserve(std::max<uint32_t>(1, memory_barrier_count));
     for (uint32_t barrier_index = 0; barrier_index < memory_barrier_count; barrier_index++) {
         const auto &barrier = barriers[barrier_index];
         SyncBarrier sync_barrier(barrier, src, dst);
         memory_barriers.emplace_back(sync_barrier);
     }
     if (0 == memory_barrier_count) {
         // If there are no global memory barriers, force an exec barrier
         memory_barriers.emplace_back(SyncBarrier(src, dst));
     }
     single_exec_scope = true;
 }

 void SyncOpBarriers::BarrierSet::MakeBufferMemoryBarriers(const SyncValidator &sync_state, const SyncExecScope &src,
                                                           const SyncExecScope &dst, VkDependencyFlags dependencyFlags,
                                                           uint32_t barrier_count, const VkBufferMemoryBarrier *barriers) {
     buffer_memory_barriers.reserve(barrier_count);
     for (uint32_t index = 0; index < barrier_count; index++) {
         const auto &barrier = barriers[index];
         auto buffer = sync_state.Get<vvl::Buffer>(barrier.buffer);
         if (buffer) {
             const auto range = MakeRange(*buffer, barrier.offset, barrier.size);
             const SyncBarrier sync_barrier(barrier, src, dst);
             buffer_memory_barriers.emplace_back(buffer, sync_barrier, range);
         } else {
             buffer_memory_barriers.emplace_back();
         }
     }
 }

 void SyncOpBarriers::BarrierSet::MakeMemoryBarriers(VkQueueFlags queue_flags, VkDependencyFlags dependency_flags,
                                                     uint32_t memory_barrier_count, const VkMemoryBarrier2 *barriers) {
     memory_barriers.reserve(memory_barrier_count);
     for (uint32_t barrier_index = 0; barrier_index < memory_barrier_count; barrier_index++) {
         const auto &barrier = barriers[barrier_index];
         auto src = SyncExecScope::MakeSrc(queue_flags, barrier.srcStageMask);
         auto dst = SyncExecScope::MakeDst(queue_flags, barrier.dstStageMask);
         SyncBarrier sync_barrier(barrier, src, dst);
         memory_barriers.emplace_back(sync_barrier);
     }
     single_exec_scope = false;
 }

 void SyncOpBarriers::BarrierSet::MakeBufferMemoryBarriers(const SyncValidator &sync_state, VkQueueFlags queue_flags,
                                                           VkDependencyFlags dependencyFlags, uint32_t barrier_count,
                                                           const VkBufferMemoryBarrier2 *barriers) {
     buffer_memory_barriers.reserve(barrier_count);
     for (uint32_t index = 0; index < barrier_count; index++) {
         const auto &barrier = barriers[index];
         auto src = SyncExecScope::MakeSrc(queue_flags, barrier.srcStageMask);
         auto dst = SyncExecScope::MakeDst(queue_flags, barrier.dstStageMask);
         auto buffer = sync_state.Get<vvl::Buffer>(barrier.buffer);
         if (buffer) {
             const auto range = MakeRange(*buffer, barrier.offset, barrier.size);
             const SyncBarrier sync_barrier(barrier, src, dst);
             buffer_memory_barriers.emplace_back(buffer, sync_barrier, range);
         } else {
             buffer_memory_barriers.emplace_back();
         }
     }
 }

 void SyncOpBarriers::BarrierSet::MakeImageMemoryBarriers(const SyncValidator &sync_state, const SyncExecScope &src,
                                                          const SyncExecScope &dst, VkDependencyFlags dependencyFlags,
                                                          uint32_t barrier_count, const VkImageMemoryBarrier *barriers) {
     image_memory_barriers.reserve(barrier_count);
     for (uint32_t index = 0; index < barrier_count; index++) {
         const auto &barrier = barriers[index];
         auto image = sync_state.Get<ImageState>(barrier.image);
         if (image) {
             auto subresource_range = NormalizeSubresourceRange(image->create_info, barrier.subresourceRange);
             const SyncBarrier sync_barrier(barrier, src, dst);
             image_memory_barriers.emplace_back(image, index, sync_barrier, barrier.oldLayout, barrier.newLayout, subresource_range);
         } else {
             image_memory_barriers.emplace_back();
             image_memory_barriers.back().index = index;  // Just in case we're interested in the ones we skipped.
         }
     }
 }

 void SyncOpBarriers::BarrierSet::MakeImageMemoryBarriers(const SyncValidator &sync_state, VkQueueFlags queue_flags,
                                                          VkDependencyFlags dependencyFlags, uint32_t barrier_count,
                                                          const VkImageMemoryBarrier2 *barriers) {
     image_memory_barriers.reserve(barrier_count);
     for (uint32_t index = 0; index < barrier_count; index++) {
         const auto &barrier = barriers[index];
         auto src = SyncExecScope::MakeSrc(queue_flags, barrier.srcStageMask);
         auto dst = SyncExecScope::MakeDst(queue_flags, barrier.dstStageMask);
         auto image = sync_state.Get<ImageState>(barrier.image);
         if (image) {
             auto subresource_range = NormalizeSubresourceRange(image->create_info, barrier.subresourceRange);
             const SyncBarrier sync_barrier(barrier, src, dst);
             image_memory_barriers.emplace_back(image, index, sync_barrier, barrier.oldLayout, barrier.newLayout, subresource_range);
         } else {
             image_memory_barriers.emplace_back();
             image_memory_barriers.back().index = index;  // Just in case we're interested in the ones we skipped.
         }
     }
 }

 SyncOpWaitEvents::SyncOpWaitEvents(vvl::Func command, const SyncValidator &sync_state, VkQueueFlags queue_flags,
                                    uint32_t eventCount, const VkEvent *pEvents, VkPipelineStageFlags srcStageMask,
                                    VkPipelineStageFlags dstStageMask, uint32_t memoryBarrierCount,
                                    const VkMemoryBarrier *pMemoryBarriers, uint32_t bufferMemoryBarrierCount,
                                    const VkBufferMemoryBarrier *pBufferMemoryBarriers, uint32_t imageMemoryBarrierCount,
                                    const VkImageMemoryBarrier *pImageMemoryBarriers)
     : SyncOpBarriers(command, sync_state, queue_flags, srcStageMask, dstStageMask, VkDependencyFlags(0U), memoryBarrierCount,
                      pMemoryBarriers, bufferMemoryBarrierCount, pBufferMemoryBarriers, imageMemoryBarrierCount,
                      pImageMemoryBarriers) {
     MakeEventsList(sync_state, eventCount, pEvents);
 }

 SyncOpWaitEvents::SyncOpWaitEvents(vvl::Func command, const SyncValidator &sync_state, VkQueueFlags queue_flags,
                                    uint32_t eventCount, const VkEvent *pEvents, const VkDependencyInfo *pDependencyInfo)
     : SyncOpBarriers(command, sync_state, queue_flags, eventCount, pDependencyInfo) {
     MakeEventsList(sync_state, eventCount, pEvents);
     assert(events_.size() == barriers_.size());  // Just so nobody gets clever and decides to cull the event or barrier arrays
 }

 const char *const SyncOpWaitEvents::kIgnored = "Wait operation is ignored for this event.";

 bool SyncOpWaitEvents::Validate(const CommandBufferAccessContext &cb_context) const {
     bool skip = false;
     const auto &sync_state = cb_context.GetSyncState();
     const VkCommandBuffer command_buffer_handle = cb_context.GetCBState().VkHandle();

     // This is only interesting at record and not replay (Execute/Submit) time.
     for (size_t barrier_set_index = 0; barrier_set_index < barriers_.size(); barrier_set_index++) {
         const auto &barrier_set = barriers_[barrier_set_index];
         if (barrier_set.single_exec_scope) {
             const Location loc(command_);
             if (barrier_set.src_exec_scope.mask_param & VK_PIPELINE_STAGE_HOST_BIT) {
                 const std::string vuid = std::string("SYNC-") + std::string(CmdName()) + std::string("-hostevent-unsupported");
                 sync_state.LogInfo(vuid, command_buffer_handle, loc,
                                    "srcStageMask includes %s, unsupported by synchronization validation.",
                                    string_VkPipelineStageFlagBits(VK_PIPELINE_STAGE_HOST_BIT));
             } else {
                 const auto &barriers = barrier_set.memory_barriers;
                 for (size_t barrier_index = 0; barrier_index < barriers.size(); barrier_index++) {
                     const auto &barrier = barriers[barrier_index];
                     if (barrier.src_exec_scope.mask_param & VK_PIPELINE_STAGE_HOST_BIT) {
                         const std::string vuid =
                             std::string("SYNC-") + std::string(CmdName()) + std::string("-hostevent-unsupported");

                         sync_state.LogInfo(vuid, command_buffer_handle, loc,
                                            "srcStageMask %s of %s %zu, %s %zu, unsupported by synchronization validation.",
                                            string_VkPipelineStageFlagBits(VK_PIPELINE_STAGE_HOST_BIT), "pDependencyInfo",
                                            barrier_set_index, "pMemoryBarriers", barrier_index);
                     }
                 }
             }
         }
     }

     // The rest is common to record time and replay time.
     skip |= DoValidate(cb_context, ResourceUsageRecord::kMaxIndex);
     return skip;
 }

 bool SyncOpWaitEvents::DoValidate(const CommandExecutionContext &exec_context, const ResourceUsageTag base_tag) const {
     bool skip = false;
     const auto &sync_state = exec_context.GetSyncState();
     const QueueId queue_id = exec_context.GetQueueId();

     VkPipelineStageFlags2 event_stage_masks = 0U;
     VkPipelineStageFlags2 barrier_mask_params = 0U;
     bool events_not_found = false;
     const auto *events_context = exec_context.GetCurrentEventsContext();
     assert(events_context);
     size_t barrier_set_index = 0;
     size_t barrier_set_incr = (barriers_.size() == 1) ? 0 : 1;
     const Location loc(command_);
     for (const auto &event : events_) {
         const auto *sync_event = events_context->Get(event.get());
         const auto &barrier_set = barriers_[barrier_set_index];
         if (!sync_event) {
             // NOTE PHASE2: This is where we'll need queue submit time validation to come back and check the srcStageMask bits
             //              or solve this with replay creating the SyncEventState in the queue context... also this will be a
             //              new validation error... wait without previously submitted set event...
             events_not_found = true;  // Demote "extra_stage_bits" error to warning, to avoid false positives at *record time*
             barrier_set_index += barrier_set_incr;
             continue;  // Core, Lifetimes, or Param check needs to catch invalid events.
         }

         // For replay calls, don't revalidate "same command buffer" events
         if (sync_event->last_command_tag >= base_tag) continue;

         const VkEvent event_handle = sync_event->event->VkHandle();
         // TODO add "destroyed" checks

         if (sync_event->first_scope) {
             // Only accumulate barrier and event stages if there is a pending set in the current context
             barrier_mask_params |= barrier_set.src_exec_scope.mask_param;
             event_stage_masks |= sync_event->scope.mask_param;
         }

         const auto &src_exec_scope = barrier_set.src_exec_scope;

         const auto ignore_reason = sync_event->IsIgnoredByWait(command_, src_exec_scope.mask_param);
         if (ignore_reason) {
             switch (ignore_reason) {
                 case SyncEventState::ResetWaitRace:
                 case SyncEventState::Reset2WaitRace: {
                     // Four permuations of Reset and Wait calls...
                     const char *vuid = (command_ == vvl::Func::vkCmdWaitEvents) ? "VUID-vkCmdResetEvent-event-03834"
                                                                                 : "VUID-vkCmdResetEvent-event-03835";
                     if (ignore_reason == SyncEventState::Reset2WaitRace) {
                         vuid = (command_ == vvl::Func::vkCmdWaitEvents) ? "VUID-vkCmdResetEvent2-event-03831"
                                                                         : "VUID-vkCmdResetEvent2-event-03832";
                     }
                     const char *const message =
                         "%s %s operation following %s without intervening execution barrier, may cause race condition. %s";
                     skip |= sync_state.LogError(vuid, event_handle, loc, message, sync_state.FormatHandle(event_handle).c_str(),
                                                 CmdName(), vvl::String(sync_event->last_command), kIgnored);
                     break;
                 }
                 case SyncEventState::SetRace: {
                     // Issue error message that Wait is waiting on an signal subject to race condition, and is thus ignored for
                     // this event
                     const char *const vuid = "SYNC-vkCmdWaitEvents-unsynchronized-setops";
                     const char *const message =
                         "%s Unsychronized %s calls result in race conditions w.r.t. event signalling, %s %s";
                     const char *const reason = "First synchronization scope is undefined.";
                     skip |= sync_state.LogError(vuid, event_handle, loc, message, sync_state.FormatHandle(event_handle).c_str(),
                                                 vvl::String(sync_event->last_command), reason, kIgnored);
                     break;
                 }
                 case SyncEventState::MissingStageBits: {
                     const auto missing_bits = sync_event->scope.mask_param & ~src_exec_scope.mask_param;
                     // Issue error message that event waited for is not in wait events scope
                     const char *const vuid = "VUID-vkCmdWaitEvents-srcStageMask-01158";
                     const char *const message = "%s stageMask %" PRIx64 " includes bits not present in srcStageMask 0x%" PRIx64
                                                 ". Bits missing from srcStageMask %s. %s";
                     skip |= sync_state.LogError(vuid, event_handle, loc, message, sync_state.FormatHandle(event_handle).c_str(),
                                                 sync_event->scope.mask_param, src_exec_scope.mask_param,
                                                 sync_utils::StringPipelineStageFlags(missing_bits).c_str(), kIgnored);
                     break;
                 }
                 case SyncEventState::SetVsWait2: {
                     skip |= sync_state.LogError(
                         "VUID-vkCmdWaitEvents2-pEvents-03837", event_handle, loc, "Follows set of %s by %s. Disallowed.",
                         sync_state.FormatHandle(event_handle).c_str(), vvl::String(sync_event->last_command));
                     break;
                 }
                 case SyncEventState::MissingSetEvent: {
                     // TODO: There are conditions at queue submit time where we can definitively say that
                     // a missing set event is an error.  Add those if not captured in CoreChecks
                     break;
                 }
                 default:
                     assert(ignore_reason == SyncEventState::NotIgnored);
             }
         } else if (barrier_set.image_memory_barriers.size()) {
             const auto &image_memory_barriers = barrier_set.image_memory_barriers;
             const auto *context = exec_context.GetCurrentAccessContext();
             assert(context);
             for (const auto &image_memory_barrier : image_memory_barriers) {
                 if (image_memory_barrier.old_layout == image_memory_barrier.new_layout) continue;
                 const auto *image_state = image_memory_barrier.image.get();
                 if (!image_state) continue;
                 const auto &subresource_range = image_memory_barrier.range;
                 const auto &src_access_scope = image_memory_barrier.barrier.src_access_scope;
                 const auto hazard = context->DetectImageBarrierHazard(
                     *image_state, subresource_range, sync_event->scope.exec_scope, src_access_scope, queue_id,
                     sync_event->FirstScope(), sync_event->first_scope_tag, AccessContext::DetectOptions::kDetectAll);
                 if (hazard.IsHazard()) {
                     const auto error =
                         sync_state.error_messages_.WaitEventsError(hazard, exec_context, image_memory_barrier.index, *image_state);
                     skip |= sync_state.SyncError(hazard.Hazard(), image_state->Handle(), loc, error);
                     break;
                 }
             }
         }
         // TODO:  Add infrastructure for checking pDependencyInfo's vs. CmdSetEvent2 VUID - vkCmdWaitEvents2KHR - pEvents -
         // 03839
         barrier_set_index += barrier_set_incr;
     }

     // Note that we can't check for HOST in pEvents as we don't track that set event type
     const auto extra_stage_bits = (barrier_mask_params & ~VK_PIPELINE_STAGE_2_HOST_BIT) & ~event_stage_masks;
     if (extra_stage_bits) {
         // Issue error message that event waited for is not in wait events scope
         // NOTE: This isn't exactly the right VUID for WaitEvents2, but it's as close as we currently have support for
         const char *const vuid = (vvl::Func::vkCmdWaitEvents == command_) ? "VUID-vkCmdWaitEvents-srcStageMask-01158"
                                                                           : "VUID-vkCmdWaitEvents2-pEvents-03838";
         const char *const message =
             "srcStageMask 0x%" PRIx64 " contains stages not present in pEvents stageMask. Extra stages are %s.%s";
         const auto handle = exec_context.Handle();
         if (events_not_found) {
             sync_state.LogInfo(vuid, handle, loc, message, barrier_mask_params,
                                sync_utils::StringPipelineStageFlags(extra_stage_bits).c_str(),
                                " vkCmdSetEvent may be in previously submitted command buffer.");
         } else {
             skip |= sync_state.LogError(vuid, handle, loc, message, barrier_mask_params,
                                         sync_utils::StringPipelineStageFlags(extra_stage_bits).c_str(), "");
         }
     }
     return skip;
 }

 struct SyncOpWaitEventsFunctorFactory {
     using BarrierOpFunctor = WaitEventBarrierOp;
     using ApplyFunctor = ApplyBarrierFunctor<BarrierOpFunctor>;
     using GlobalBarrierOpFunctor = WaitEventBarrierOp;
     using GlobalApplyFunctor = ApplyBarrierOpsFunctor<GlobalBarrierOpFunctor>;
     using BufferRange = EventSimpleRangeGenerator;
     using ImageRange = EventImageRangeGenerator;
     using GlobalRange = EventSimpleRangeGenerator;
     using ImageState = syncval_state::ImageState;

     // Need to restrict to only valid exec and access scope for this event
     // Pass by value is intentional to get a copy we can change without modifying the passed barrier
     SyncBarrier RestrictToEvent(SyncBarrier barrier) const {
         barrier.src_exec_scope.exec_scope = sync_event->scope.exec_scope & barrier.src_exec_scope.exec_scope;
         barrier.src_access_scope = sync_event->scope.valid_accesses & barrier.src_access_scope;
         return barrier;
     }
     ApplyFunctor MakeApplyFunctor(QueueId queue_id, const SyncBarrier &barrier_arg, bool layout_transition) const {
         auto barrier = RestrictToEvent(barrier_arg);
         return ApplyFunctor(BarrierOpFunctor(queue_id, sync_event->first_scope_tag, barrier, layout_transition));
     }
     GlobalApplyFunctor MakeGlobalApplyFunctor(size_t size_hint, ResourceUsageTag tag) const {
         return GlobalApplyFunctor(false /* don't resolve */, size_hint, tag);
     }
     GlobalBarrierOpFunctor MakeGlobalBarrierOpFunctor(const QueueId queue_id, const SyncBarrier &barrier_arg) const {
         auto barrier = RestrictToEvent(barrier_arg);
         return GlobalBarrierOpFunctor(queue_id, sync_event->first_scope_tag, barrier, false);
     }

     BufferRange MakeRangeGen(const vvl::Buffer &buffer, const ResourceAccessRange &range_arg) const {
         const auto base_address = ResourceBaseAddress(buffer);
         ResourceAccessRange range = SimpleBinding(buffer) ? (range_arg + base_address) : ResourceAccessRange();
         EventSimpleRangeGenerator filtered_range_gen(sync_event->FirstScope(), range);
         return filtered_range_gen;
     }
     ImageRange MakeRangeGen(const ImageState &image, const VkImageSubresourceRange &subresource_range) const {
         ImageRangeGen image_range_gen = image.MakeImageRangeGen(subresource_range, false);
         EventImageRangeGenerator filtered_range_gen(sync_event->FirstScope(), image_range_gen);

         return filtered_range_gen;
     }
     GlobalRange MakeGlobalRangeGen() const { return EventSimpleRangeGenerator(sync_event->FirstScope(), kFullRange); }
     SyncOpWaitEventsFunctorFactory(SyncEventState *sync_event_) : sync_event(sync_event_) { assert(sync_event); }
     SyncEventState *sync_event;
 };

 ResourceUsageTag SyncOpWaitEvents::Record(CommandBufferAccessContext *cb_context) {
     const auto tag = cb_context->NextCommandTag(command_);

     ReplayRecord(*cb_context, tag);
     return tag;
 }

 void SyncOpWaitEvents::ReplayRecord(CommandExecutionContext &exec_context, ResourceUsageTag exec_tag) const {
     // Unlike PipelineBarrier, WaitEvent is *not* limited to accesses within the current subpass (if any) and thus needs to import
     // all accesses. Can instead import for all first_scopes, or a union of them, if this becomes a performance/memory issue,
     // but with no idea of the performance of the union, nor of whether it even matters... take the simplest approach here,
     if (!exec_context.ValidForSyncOps()) return;
     AccessContext *access_context = exec_context.GetCurrentAccessContext();
     SyncEventsContext *events_context = exec_context.GetCurrentEventsContext();
     const QueueId queue_id = exec_context.GetQueueId();

     access_context->ResolvePreviousAccesses();

     size_t barrier_set_index = 0;
     size_t barrier_set_incr = (barriers_.size() == 1) ? 0 : 1;
     assert(barriers_.size() == 1 || (barriers_.size() == events_.size()));
     for (auto &event_shared : events_) {
         if (!event_shared.get()) continue;
         auto *sync_event = events_context->GetFromShared(event_shared);

         sync_event->last_command = command_;
         sync_event->last_command_tag = exec_tag;

         const auto &barrier_set = barriers_[barrier_set_index];
         const auto &dst = barrier_set.dst_exec_scope;
         if (!sync_event->IsIgnoredByWait(command_, barrier_set.src_exec_scope.mask_param)) {
             // These apply barriers one at a time as the are restricted to the resource ranges specified per each barrier,
             // but do not update the dependency chain information (but set the "pending" state) // s.t. the order independence
             // of the barriers is maintained.
             SyncOpWaitEventsFunctorFactory factory(sync_event);
             ApplyBarriers(barrier_set.buffer_memory_barriers, factory, queue_id, exec_tag, access_context);
             ApplyBarriers(barrier_set.image_memory_barriers, factory, queue_id, exec_tag, access_context);
             ApplyGlobalBarriers(barrier_set.memory_barriers, factory, queue_id, exec_tag, access_context);

             // Apply the global barrier to the event itself (for race condition tracking)
             // Events don't happen at a stage, so we need to store the unexpanded ALL_COMMANDS if set for inter-event-calls
             sync_event->barriers = dst.mask_param & VK_PIPELINE_STAGE_ALL_COMMANDS_BIT;
             sync_event->barriers |= dst.exec_scope;
         } else {
             // We ignored this wait, so we don't have any effective synchronization barriers for it.
             sync_event->barriers = 0U;
         }
         barrier_set_index += barrier_set_incr;
     }

     // Apply the pending barriers
     ResolvePendingBarrierFunctor apply_pending_action(exec_tag);
     access_context->ApplyToContext(apply_pending_action);
 }

 bool SyncOpWaitEvents::ReplayValidate(ReplayState &replay, ResourceUsageTag recorded_tag) const {
     return DoValidate(replay.GetExecutionContext(), replay.GetBaseTag() + recorded_tag);
 }

 void SyncOpWaitEvents::MakeEventsList(const SyncValidator &sync_state, uint32_t event_count, const VkEvent *events) {
     events_.reserve(event_count);
     for (uint32_t event_index = 0; event_index < event_count; event_index++) {
         events_.emplace_back(sync_state.Get<vvl::Event>(events[event_index]));
     }
 }

 SyncOpResetEvent::SyncOpResetEvent(vvl::Func command, const SyncValidator &sync_state, VkQueueFlags queue_flags, VkEvent event,
                                    VkPipelineStageFlags2 stageMask)
     : SyncOpBase(command), event_(sync_state.Get<vvl::Event>(event)), exec_scope_(SyncExecScope::MakeSrc(queue_flags, stageMask)) {}

 bool SyncOpResetEvent::Validate(const CommandBufferAccessContext &cb_context) const {
     return DoValidate(cb_context, ResourceUsageRecord::kMaxIndex);
 }

 bool SyncOpResetEvent::DoValidate(const CommandExecutionContext &exec_context, const ResourceUsageTag base_tag) const {
     auto *events_context = exec_context.GetCurrentEventsContext();
     assert(events_context);
     bool skip = false;
     if (!events_context) return skip;

     const auto &sync_state = exec_context.GetSyncState();
     const auto *sync_event = events_context->Get(event_);
     if (!sync_event) return skip;  // Core, Lifetimes, or Param check needs to catch invalid events.

     if (sync_event->last_command_tag > base_tag) return skip;  // if we validated this in recording of the secondary, don't repeat

     const char *const set_wait =
         "%s %s operation following %s without intervening execution barrier, is a race condition and may result in data "
         "hazards.";
     const char *message = set_wait;  // Only one message this call.
     if (!sync_event->HasBarrier(exec_scope_.mask_param, exec_scope_.exec_scope)) {
         const char *vuid = nullptr;
         switch (sync_event->last_command) {
             case vvl::Func::vkCmdSetEvent:
             case vvl::Func::vkCmdSetEvent2KHR:
             case vvl::Func::vkCmdSetEvent2:
                 // Needs a barrier between set and reset
                 vuid = "SYNC-vkCmdResetEvent-missingbarrier-set";
                 break;
             case vvl::Func::vkCmdWaitEvents:
             case vvl::Func::vkCmdWaitEvents2KHR:
             case vvl::Func::vkCmdWaitEvents2: {
                 // Needs to be in the barriers chain (either because of a barrier, or because of dstStageMask
                 vuid = "SYNC-vkCmdResetEvent-missingbarrier-wait";
                 break;
             }
             case vvl::Func::Empty:
             case vvl::Func::vkCmdResetEvent:
             case vvl::Func::vkCmdResetEvent2KHR:
             case vvl::Func::vkCmdResetEvent2:
                 break;  // Valid, but nothing to do
             default:
                 assert(false);
                 break;
         }
         if (vuid) {
             const Location loc(command_);
             skip |= sync_state.LogError(vuid, event_->Handle(), loc, message, sync_state.FormatHandle(event_->Handle()).c_str(),
                                         CmdName(), vvl::String(sync_event->last_command));
         }
     }
     return skip;
 }

 ResourceUsageTag SyncOpResetEvent::Record(CommandBufferAccessContext *cb_context) {
     const auto tag = cb_context->NextCommandTag(command_);
     ReplayRecord(*cb_context, tag);
     return tag;
 }

 bool SyncOpResetEvent::ReplayValidate(ReplayState &replay, ResourceUsageTag recorded_tag) const {
     return DoValidate(replay.GetExecutionContext(), replay.GetBaseTag() + recorded_tag);
 }

 void SyncOpResetEvent::ReplayRecord(CommandExecutionContext &exec_context, ResourceUsageTag exec_tag) const {
     if (!exec_context.ValidForSyncOps()) return;
     SyncEventsContext *events_context = exec_context.GetCurrentEventsContext();

     auto *sync_event = events_context->GetFromShared(event_);
     if (!sync_event) return;  // Core, Lifetimes, or Param check needs to catch invalid events.

     // Update the event state
     sync_event->last_command = command_;
     sync_event->last_command_tag = exec_tag;
     sync_event->unsynchronized_set = vvl::Func::Empty;
     sync_event->ResetFirstScope();
     sync_event->barriers = 0U;
 }

 SyncOpSetEvent::SyncOpSetEvent(vvl::Func command, const SyncValidator &sync_state, VkQueueFlags queue_flags, VkEvent event,
                                VkPipelineStageFlags2 stageMask, const AccessContext *access_context)
     : SyncOpBase(command),
       event_(sync_state.Get<vvl::Event>(event)),
       recorded_context_(),
       src_exec_scope_(SyncExecScope::MakeSrc(queue_flags, stageMask)),
       dep_info_() {
     // Snapshot the current access_context for later inspection at wait time.
     // NOTE: This appears brute force, but given that we only save a "first-last" model of access history, the current
     //       access context (include barrier state for chaining) won't necessarily contain the needed information at Wait
     //       or Submit time reference.
     if (access_context) {
         recorded_context_ = std::make_shared<const AccessContext>(*access_context);
     }
 }

 SyncOpSetEvent::SyncOpSetEvent(vvl::Func command, const SyncValidator &sync_state, VkQueueFlags queue_flags, VkEvent event,
                                const VkDependencyInfo &dep_info, const AccessContext *access_context)
     : SyncOpBase(command),
       event_(sync_state.Get<vvl::Event>(event)),
       recorded_context_(),
       src_exec_scope_(SyncExecScope::MakeSrc(queue_flags, sync_utils::GetGlobalStageMasks(dep_info).src)),
       dep_info_(new vku::safe_VkDependencyInfo(&dep_info)) {
     if (access_context) {
         recorded_context_ = std::make_shared<const AccessContext>(*access_context);
     }
 }

 bool SyncOpSetEvent::Validate(const CommandBufferAccessContext &cb_context) const {
     return DoValidate(cb_context, ResourceUsageRecord::kMaxIndex);
 }
 bool SyncOpSetEvent::ReplayValidate(ReplayState &replay, ResourceUsageTag recorded_tag) const {
     return DoValidate(replay.GetExecutionContext(), replay.GetBaseTag() + recorded_tag);
 }

 bool SyncOpSetEvent::DoValidate(const CommandExecutionContext &exec_context, const ResourceUsageTag base_tag) const {
     bool skip = false;

     const auto &sync_state = exec_context.GetSyncState();
     auto *events_context = exec_context.GetCurrentEventsContext();
     assert(events_context);
     if (!events_context) return skip;

     const auto *sync_event = events_context->Get(event_);
     if (!sync_event) return skip;  // Core, Lifetimes, or Param check needs to catch invalid events.

     if (sync_event->last_command_tag >= base_tag) return skip;  // for replay we don't want to revalidate internal "last commmand"

     const char *const reset_set =
         "%s %s operation following %s without intervening execution barrier, is a race condition and may result in data "
         "hazards.";
     const char *const wait =
         "%s %s operation following %s without intervening vkCmdResetEvent, may result in data hazard and is ignored.";

     if (!sync_event->HasBarrier(src_exec_scope_.mask_param, src_exec_scope_.exec_scope)) {
         const char *vuid_stem = nullptr;
         const char *message = nullptr;
         switch (sync_event->last_command) {
             case vvl::Func::vkCmdResetEvent:
             case vvl::Func::vkCmdResetEvent2KHR:
             case vvl::Func::vkCmdResetEvent2:
                 // Needs a barrier between reset and set
                 vuid_stem = "-missingbarrier-reset";
                 message = reset_set;
                 break;
             case vvl::Func::vkCmdSetEvent:
             case vvl::Func::vkCmdSetEvent2KHR:
             case vvl::Func::vkCmdSetEvent2:
                 // Needs a barrier between set and set
                 vuid_stem = "-missingbarrier-set";
                 message = reset_set;
                 break;
             case vvl::Func::vkCmdWaitEvents:
             case vvl::Func::vkCmdWaitEvents2KHR:
             case vvl::Func::vkCmdWaitEvents2:
                 // Needs a barrier or is in second execution scope
                 vuid_stem = "-missingbarrier-wait";
                 message = wait;
                 break;
             default:
                 // The only other valid last command that wasn't one.
                 assert(sync_event->last_command == vvl::Func::Empty);
                 break;
         }
         if (vuid_stem) {
             assert(nullptr != message);
             const Location loc(command_);
             std::string vuid("SYNC-");
             vuid.append(CmdName()).append(vuid_stem);
             skip |=
                 sync_state.LogError(vuid.c_str(), event_->Handle(), loc, message, sync_state.FormatHandle(event_->Handle()).c_str(),
                                     CmdName(), vvl::String(sync_event->last_command));
         }
     }

     return skip;
 }

 ResourceUsageTag SyncOpSetEvent::Record(CommandBufferAccessContext *cb_context) {
     const auto tag = cb_context->NextCommandTag(command_);
     auto *events_context = cb_context->GetCurrentEventsContext();
     const QueueId queue_id = cb_context->GetQueueId();
     assert(recorded_context_);
     if (recorded_context_ && events_context) {
         DoRecord(queue_id, tag, recorded_context_, events_context);
     }
     return tag;
 }

 void SyncOpSetEvent::ReplayRecord(CommandExecutionContext &exec_context, ResourceUsageTag exec_tag) const {
     // Create a copy of the current context, and merge in the state snapshot at record set event time
     // Note: we mustn't change the recorded context copy, as a given CB could be submitted more than once (in generaL)
     if (!exec_context.ValidForSyncOps()) return;
     SyncEventsContext *events_context = exec_context.GetCurrentEventsContext();
     AccessContext *access_context = exec_context.GetCurrentAccessContext();
     const QueueId queue_id = exec_context.GetQueueId();

     // Note: merged_context is a copy of the access_context, combined with the recorded context
     auto merged_context = std::make_shared<AccessContext>(*access_context);
     merged_context->ResolveFromContext(QueueTagOffsetBarrierAction(queue_id, exec_tag), *recorded_context_);
     merged_context->TrimAndClearFirstAccess();  // Ensure the copy is minimal and normalized
     DoRecord(queue_id, exec_tag, merged_context, events_context);
 }

 void SyncOpSetEvent::DoRecord(QueueId queue_id, ResourceUsageTag tag, const std::shared_ptr<const AccessContext> &access_context,
                               SyncEventsContext *events_context) const {
     auto *sync_event = events_context->GetFromShared(event_);
     if (!sync_event) return;  // Core, Lifetimes, or Param check needs to catch invalid events.

     // NOTE: We're going to simply record the sync scope here, as anything else would be implementation defined/undefined
     //       and we're issuing errors re: missing barriers between event commands, which if the user fixes would fix
     //       any issues caused by naive scope setting here.

     // What happens with two SetEvent is that one cannot know what group of operations will be waited for.
     // Given:
     //     Stuff1; SetEvent; Stuff2; SetEvent; WaitEvents;
     // WaitEvents cannot know which of Stuff1, Stuff2, or both has completed execution.

     if (!sync_event->HasBarrier(src_exec_scope_.mask_param, src_exec_scope_.exec_scope)) {
         sync_event->unsynchronized_set = sync_event->last_command;
         sync_event->ResetFirstScope();
     } else if (!sync_event->first_scope) {
         // We only set the scope if there isn't one
         sync_event->scope = src_exec_scope_;

         // Save the shared_ptr to copy of the access_context present at set time (sent us by the caller)
         sync_event->first_scope = access_context;
         sync_event->unsynchronized_set = vvl::Func::Empty;
         sync_event->first_scope_tag = tag;
     }
     // TODO: Store dep_info_ shared ptr in sync_state for WaitEvents2 validation
     sync_event->last_command = command_;
     sync_event->last_command_tag = tag;
     sync_event->barriers = 0U;
 }

 SyncOpBeginRenderPass::SyncOpBeginRenderPass(vvl::Func command, const SyncValidator &sync_state,
                                              const VkRenderPassBeginInfo *pRenderPassBegin,
                                              const VkSubpassBeginInfo *pSubpassBeginInfo)
     : SyncOpBase(command), rp_context_(nullptr) {
     if (pRenderPassBegin) {
         rp_state_ = sync_state.Get<vvl::RenderPass>(pRenderPassBegin->renderPass);
         renderpass_begin_info_ = vku::safe_VkRenderPassBeginInfo(pRenderPassBegin);
         auto fb_state = sync_state.Get<vvl::Framebuffer>(pRenderPassBegin->framebuffer);
         if (fb_state) {
             shared_attachments_ = sync_state.GetAttachmentViews(*renderpass_begin_info_.ptr(), *fb_state);
             // TODO: Revisit this when all attachment validation is through SyncOps to see if we can discard the plain pointer copy
             // Note that this a safe to presist as long as shared_attachments is not cleared
             attachments_.reserve(shared_attachments_.size());
             for (const auto &attachment : shared_attachments_) {
                 attachments_.emplace_back(static_cast<const syncval_state::ImageViewState *>(attachment.get()));
             }
         }
         if (pSubpassBeginInfo) {
             subpass_begin_info_ = vku::safe_VkSubpassBeginInfo(pSubpassBeginInfo);
         }
     }
 }

 bool SyncOpBeginRenderPass::Validate(const CommandBufferAccessContext &cb_context) const {
     // Check if any of the layout transitions are hazardous.... but we don't have the renderpass context to work with, so we
     bool skip = false;

     assert(rp_state_.get());
     if (nullptr == rp_state_.get()) return skip;
     auto &rp_state = *rp_state_.get();

     const uint32_t subpass = 0;

     // Construct the state we can use to validate against... (since validation is const and RecordCmdBeginRenderPass
     // hasn't happened yet)
     const std::vector<AccessContext> empty_context_vector;
     AccessContext temp_context(subpass, cb_context.GetQueueFlags(), rp_state.subpass_dependencies, empty_context_vector,
                                cb_context.GetCurrentAccessContext());

     // Validate attachment operations
     if (attachments_.empty()) return skip;
     const auto &render_area = renderpass_begin_info_.renderArea;

     // Since the isn't a valid RenderPassAccessContext until Record, needs to create the view/generator list... we could limit this
     // by predicating on whether subpass 0 uses the attachment if it is too expensive to create the full list redundantly here.
     // More broadly we could look at thread specific state shared between Validate and Record as is done for other heavyweight
     // operations (though it's currently a messy approach)
     AttachmentViewGenVector view_gens = RenderPassAccessContext::CreateAttachmentViewGen(render_area, attachments_);
     skip |= RenderPassAccessContext::ValidateLayoutTransitions(cb_context, temp_context, rp_state, render_area, subpass, view_gens,
                                                                command_);

     // Validate load operations if there were no layout transition hazards
     if (!skip) {
         RenderPassAccessContext::RecordLayoutTransitions(rp_state, subpass, view_gens, kInvalidTag, temp_context);
         skip |= RenderPassAccessContext::ValidateLoadOperation(cb_context, temp_context, rp_state, render_area, subpass, view_gens,
                                                                command_);
     }

     return skip;
 }

 ResourceUsageTag SyncOpBeginRenderPass::Record(CommandBufferAccessContext *cb_context) {
     assert(rp_state_.get());
     if (nullptr == rp_state_.get()) return cb_context->NextCommandTag(command_);
     const ResourceUsageTag begin_tag =
         cb_context->RecordBeginRenderPass(command_, *rp_state_.get(), renderpass_begin_info_.renderArea, attachments_);

     // Note: this state update must be after RecordBeginRenderPass as there is no current render pass until that function runs
     rp_context_ = cb_context->GetCurrentRenderPassContext();

     return begin_tag;
 }

 bool SyncOpBeginRenderPass::ReplayValidate(ReplayState &replay, ResourceUsageTag recorded_tag) const {
     CommandExecutionContext &exec_context = replay.GetExecutionContext();
     // can't be kExecuted, this operation is not allowed in secondary command buffers
     assert(exec_context.Type() == CommandExecutionContext::kSubmitted);
     auto &batch_context = static_cast<QueueBatchContext &>(exec_context);
     batch_context.BeginRenderPassReplaySetup(replay, *this);

     // Only the layout transitions happen at the replay tag, loadOp's happen at a subsequent tag
     ResourceUsageRange first_use_range = {recorded_tag, recorded_tag + 1};
     return replay.DetectFirstUseHazard(first_use_range);
 }

 void SyncOpBeginRenderPass::ReplayRecord(CommandExecutionContext &exec_context, ResourceUsageTag exec_tag) const {
     // All the needed replay state changes (for the layout transition, and context update) have to happen in ReplayValidate
 }

 SyncOpNextSubpass::SyncOpNextSubpass(vvl::Func command, const SyncValidator &sync_state,
                                      const VkSubpassBeginInfo *pSubpassBeginInfo, const VkSubpassEndInfo *pSubpassEndInfo)
     : SyncOpBase(command) {
     if (pSubpassBeginInfo) {
         subpass_begin_info_.initialize(pSubpassBeginInfo);
     }
     if (pSubpassEndInfo) {
         subpass_end_info_.initialize(pSubpassEndInfo);
     }
 }

 bool SyncOpNextSubpass::Validate(const CommandBufferAccessContext &cb_context) const {
     bool skip = false;
     const auto *renderpass_context = cb_context.GetCurrentRenderPassContext();
     if (!renderpass_context) return skip;

     skip |= renderpass_context->ValidateNextSubpass(cb_context, command_);
     return skip;
 }

 ResourceUsageTag SyncOpNextSubpass::Record(CommandBufferAccessContext *cb_context) {
     return cb_context->RecordNextSubpass(command_);
 }

 bool SyncOpNextSubpass::ReplayValidate(ReplayState &replay, ResourceUsageTag recorded_tag) const {
     // Any store/resolve operations happen before the NextSubpass tag so we can advance to the next subpass state
     CommandExecutionContext &exec_context = replay.GetExecutionContext();
     // can't be kExecuted, this operation is not allowed in secondary command buffers
     assert(exec_context.Type() == CommandExecutionContext::kSubmitted);
     auto &batch_context = static_cast<QueueBatchContext &>(exec_context);
     batch_context.NextSubpassReplaySetup(replay);

     // Only the layout transitions happen at the replay tag, loadOp's happen at a subsequent tag
     ResourceUsageRange first_use_range = {recorded_tag, recorded_tag + 1};
     return replay.DetectFirstUseHazard(first_use_range);
 }

 void SyncOpNextSubpass::ReplayRecord(CommandExecutionContext &exec_context, ResourceUsageTag exec_tag) const {
     // All the needed replay state changes (for the layout transition, and context update) have to happen in ReplayValidate
 }
 SyncOpEndRenderPass::SyncOpEndRenderPass(vvl::Func command, const SyncValidator &sync_state,
                                          const VkSubpassEndInfo *pSubpassEndInfo)
     : SyncOpBase(command) {
     if (pSubpassEndInfo) {
         subpass_end_info_.initialize(pSubpassEndInfo);
     }
 }

 bool SyncOpEndRenderPass::Validate(const CommandBufferAccessContext &cb_context) const {
     bool skip = false;
     const auto *renderpass_context = cb_context.GetCurrentRenderPassContext();

     if (!renderpass_context) return skip;
     skip |= renderpass_context->ValidateEndRenderPass(cb_context, command_);
     return skip;
 }

 ResourceUsageTag SyncOpEndRenderPass::Record(CommandBufferAccessContext *cb_context) {
     return cb_context->RecordEndRenderPass(command_);
 }

 bool SyncOpEndRenderPass::ReplayValidate(ReplayState &replay, ResourceUsageTag recorded_tag) const {
     // Any store/resolve operations happen before the EndRenderPass tag so we can ignore them
     // Only the layout transitions happen at the replay tag
     ResourceUsageRange first_use_range = {recorded_tag, recorded_tag + 1};
     bool skip = false;
     skip |= replay.DetectFirstUseHazard(first_use_range);

     // We can cleanup here as the recorded tag represents the final layout transition (which is the last operation or the RP)
     CommandExecutionContext &exec_context = replay.GetExecutionContext();
     // can't be kExecuted, this operation is not allowed in secondary command buffers
     assert(exec_context.Type() == CommandExecutionContext::kSubmitted);
     auto &batch_context = static_cast<QueueBatchContext &>(exec_context);
     batch_context.EndRenderPassReplayCleanup(replay);

     return skip;
 }

 void SyncOpEndRenderPass::ReplayRecord(CommandExecutionContext &exec_context, ResourceUsageTag exec_tag) const {}

 ReplayState::ReplayState(CommandExecutionContext &exec_context, const CommandBufferAccessContext &recorded_context,
                          const ErrorObject &error_obj, uint32_t index, ResourceUsageTag base_tag)
     : exec_context_(exec_context), recorded_context_(recorded_context), error_obj_(error_obj), index_(index), base_tag_(base_tag) {}

 AccessContext *ReplayState::ReplayStateRenderPassBegin(VkQueueFlags queue_flags, const SyncOpBeginRenderPass &begin_op,
                                                        const AccessContext &external_context) {
     return rp_replay_.Begin(queue_flags, begin_op, external_context);
 }

 AccessContext *ReplayState::ReplayStateRenderPassNext() { return rp_replay_.Next(); }

 void ReplayState::ReplayStateRenderPassEnd(AccessContext &external_context) { rp_replay_.End(external_context); }

 const AccessContext *ReplayState::GetRecordedAccessContext() const {
     if (rp_replay_) {
         return rp_replay_.replay_context;
     }
     return recorded_context_.GetCurrentAccessContext();
 }

 bool ReplayState::DetectFirstUseHazard(const ResourceUsageRange &first_use_range) const {
     bool skip = false;
     if (first_use_range.non_empty()) {
         // We're allowing for the Replay(Validate|Record) to modify the exec_context (e.g. for Renderpass operations), so
         // we need to fetch the current access context each time
         const HazardResult hazard = GetRecordedAccessContext()->DetectFirstUseHazard(exec_context_.GetQueueId(), first_use_range,
                                                                                      *exec_context_.GetCurrentAccessContext());

         if (hazard.IsHazard()) {
             const SyncValidator &sync_state = exec_context_.GetSyncState();
             const auto handle = exec_context_.Handle();
             const VkCommandBuffer recorded_handle = recorded_context_.GetCBState().VkHandle();
             const auto error =
                 sync_state.error_messages_.FirstUseError(hazard, exec_context_, recorded_context_, index_, recorded_handle);
             skip |= sync_state.SyncError(hazard.Hazard(), handle, error_obj_.location, error);
         }
     }
     return skip;
 }

 bool ReplayState::ValidateFirstUse() {
     if (!exec_context_.ValidForSyncOps()) return false;

     bool skip = false;
     ResourceUsageRange first_use_range = {0, 0};

     for (const auto &sync_op : recorded_context_.GetSyncOps()) {
         // Set the range to cover all accesses until the next sync_op, and validate
         first_use_range.end = sync_op.tag;
         skip |= DetectFirstUseHazard(first_use_range);

         // Call to replay validate support for syncop with non-trivial replay
         skip |= sync_op.sync_op->ReplayValidate(*this, sync_op.tag);

         // Record the barrier into the proxy context.
         sync_op.sync_op->ReplayRecord(exec_context_, base_tag_ + sync_op.tag);
         first_use_range.begin = sync_op.tag + 1;
     }

     // and anything after the last syncop
     first_use_range.end = ResourceUsageRecord::kMaxIndex;
     skip |= DetectFirstUseHazard(first_use_range);

     return skip;
 }
 AccessContext *ReplayState::RenderPassReplayState::Begin(VkQueueFlags queue_flags, const SyncOpBeginRenderPass &begin_op_,
                                                          const AccessContext &external_context) {
     Reset();

     begin_op = &begin_op_;
     subpass = 0;

     const RenderPassAccessContext *rp_context = begin_op->GetRenderPassAccessContext();
     assert(rp_context);
     replay_context = &rp_context->GetContexts()[0];

     InitSubpassContexts(queue_flags, *rp_context->GetRenderPassState(), &external_context, subpass_contexts);

     // Replace the Async contexts with the the async context of the "external" context
     // For replay we don't care about async subpasses, just async queue batches
     for (auto &context : subpass_contexts) {
         context.ClearAsyncContexts();
         context.ImportAsyncContexts(external_context);
     }

     return &subpass_contexts[0];
 }

 AccessContext *ReplayState::RenderPassReplayState::Next() {
     subpass++;

     const RenderPassAccessContext *rp_context = begin_op->GetRenderPassAccessContext();

     replay_context = &rp_context->GetContexts()[subpass];
     return &subpass_contexts[subpass];
 }

 void ReplayState::RenderPassReplayState::End(AccessContext &external_context) {
     external_context.ResolveChildContexts(subpass_contexts);
     Reset();
 }

 void SyncEventsContext::ApplyBarrier(const SyncExecScope &src, const SyncExecScope &dst, ResourceUsageTag tag) {
     const bool all_commands_bit = 0 != (src.mask_param & VK_PIPELINE_STAGE_ALL_COMMANDS_BIT);
     for (auto &event_pair : map_) {
         assert(event_pair.second);  // Shouldn't be storing empty
         auto &sync_event = *event_pair.second;
         // Events don't happen at a stage, so we need to check and store the unexpanded ALL_COMMANDS if set for inter-event-calls
         // But only if occuring before the tag
         if (((sync_event.barriers & src.exec_scope) || all_commands_bit) && (sync_event.last_command_tag <= tag)) {
             sync_event.barriers |= dst.exec_scope;
             sync_event.barriers |= dst.mask_param & VK_PIPELINE_STAGE_ALL_COMMANDS_BIT;
         }
     }
 }

 void SyncEventsContext::ApplyTaggedWait(VkQueueFlags queue_flags, ResourceUsageTag tag) {
     const SyncExecScope src_scope =
         SyncExecScope::MakeSrc(queue_flags, VK_PIPELINE_STAGE_2_ALL_COMMANDS_BIT, VK_PIPELINE_STAGE_2_HOST_BIT);
     const SyncExecScope dst_scope = SyncExecScope::MakeDst(queue_flags, VK_PIPELINE_STAGE_2_ALL_COMMANDS_BIT);
     ApplyBarrier(src_scope, dst_scope, tag);
 }

 SyncEventsContext &SyncEventsContext::DeepCopy(const SyncEventsContext &from) {
     // We need a deep copy of the const context to update during validation phase
     for (const auto &event : from.map_) {
         map_.emplace(event.first, std::make_shared<SyncEventState>(*event.second));
     }
     return *this;
 }

 void SyncEventsContext::AddReferencedTags(ResourceUsageTagSet &referenced) const {
     for (const auto &event : map_) {
         const std::shared_ptr<const SyncEventState> &event_state = event.second;
         if (event_state) {
             event_state->AddReferencedTags(referenced);
         }
     }
 }

 SyncEventState::SyncEventState(const SyncEventState::EventPointer &event_state) : SyncEventState() {
     event = event_state;
     destroyed = (event.get() == nullptr) || event_state->Destroyed();
 }

 void SyncEventState::ResetFirstScope() {
     first_scope.reset();
     scope = SyncExecScope();
     first_scope_tag = 0;
 }

 // Keep the "ignore this event" logic in same place for ValidateWait and RecordWait to use
 SyncEventState::IgnoreReason SyncEventState::IsIgnoredByWait(vvl::Func command, VkPipelineStageFlags2 srcStageMask) const {
     IgnoreReason reason = NotIgnored;

     if ((vvl::Func::vkCmdWaitEvents2KHR == command || vvl::Func::vkCmdWaitEvents2 == command) &&
         (vvl::Func::vkCmdSetEvent == last_command)) {
         reason = SetVsWait2;
     } else if ((last_command == vvl::Func::vkCmdResetEvent || last_command == vvl::Func::vkCmdResetEvent2KHR) &&
                !HasBarrier(0U, 0U)) {
         reason = (last_command == vvl::Func::vkCmdResetEvent) ? ResetWaitRace : Reset2WaitRace;
     } else if (unsynchronized_set != vvl::Func::Empty) {
         reason = SetRace;
     } else if (first_scope) {
         const VkPipelineStageFlags2 missing_bits = scope.mask_param & ~srcStageMask;
         // Note it is the "not missing bits" path that is the only "NotIgnored" path
         if (missing_bits) reason = MissingStageBits;
     } else {
         reason = MissingSetEvent;
     }

     return reason;
 }

 bool SyncEventState::HasBarrier(VkPipelineStageFlags2 stageMask, VkPipelineStageFlags2 exec_scope_arg) const {
     return (last_command == vvl::Func::Empty) || (stageMask & VK_PIPELINE_STAGE_ALL_COMMANDS_BIT) || (barriers & exec_scope_arg) ||
            (barriers & VK_PIPELINE_STAGE_ALL_COMMANDS_BIT);
 }

 void SyncEventState::AddReferencedTags(ResourceUsageTagSet &referenced) const {
     if (first_scope) {
         first_scope->AddReferencedTags(referenced);
     }
 }