pre_process/m__mpi__common_8fpp_8f90_source.html

# 1 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!>

!! @file

!! @brief Contains module m_mpi_common


# 1 "/home/runner/work/MFC/MFC/src/common/include/case.fpp" 1

! This file exists so that Fypp can be run without generating case.fpp files for

! each target. This is useful when generating documentation, for example. This

! should also let MFC be built with CMake directly, without invoking mfc.sh.


! For pre-process.

# 9 "/home/runner/work/MFC/MFC/src/common/include/case.fpp"


! For moving immersed boundaries in simulation

# 14 "/home/runner/work/MFC/MFC/src/common/include/case.fpp"

# 6 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp" 2

# 1 "/home/runner/work/MFC/MFC/src/common/include/macros.fpp" 1

# 1 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp" 1

# 1 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp" 1

# 2 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

# 3 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

# 4 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

# 5 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

# 6 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 8 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

# 9 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

# 10 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 17 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 46 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 58 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 68 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 98 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 110 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 120 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

! New line at end of file is required for FYPP

# 2 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp" 2

# 1 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp" 1

# 1 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp" 1

# 2 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

# 3 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

# 4 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

# 5 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

# 6 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 8 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

# 9 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

# 10 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 17 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 46 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 58 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 68 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 98 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 110 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 120 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

! New line at end of file is required for FYPP

# 2 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp" 2


# 4 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"

# 5 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"

# 6 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"

# 7 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"

# 8 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 20 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 43 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 48 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 53 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 58 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 63 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 68 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 76 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 81 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 86 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 91 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 96 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 101 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 106 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 111 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 116 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 121 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 151 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 192 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 207 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 232 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 243 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 245 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"

# 255 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 283 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 293 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 303 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 312 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 329 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 339 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 346 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 352 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 358 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 364 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 370 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"


# 376 "/home/runner/work/MFC/MFC/src/common/include/omp_macros.fpp"

! New line at end of file is required for FYPP

# 3 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp" 2

# 1 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp" 1

# 1 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp" 1

# 2 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

# 3 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

# 4 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

# 5 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

# 6 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 8 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

# 9 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

# 10 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 17 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 46 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 58 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 68 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 98 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 110 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"


# 120 "/home/runner/work/MFC/MFC/src/common/include/shared_parallel_macros.fpp"

! New line at end of file is required for FYPP

# 2 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp" 2


# 7 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 17 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 22 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 27 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 32 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 37 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 42 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 47 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 52 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 57 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 62 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 73 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 78 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 83 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 88 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 103 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 131 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 160 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 175 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 192 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 213 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 241 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 256 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 266 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 275 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 291 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 301 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"


# 308 "/home/runner/work/MFC/MFC/src/common/include/acc_macros.fpp"

! New line at end of file is required for FYPP

# 4 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp" 2


# 21 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 37 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 50 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 104 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 119 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 130 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 143 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 171 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 182 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 193 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 204 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 214 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 225 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 236 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 246 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 252 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 258 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 264 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 270 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"


# 272 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"

# 273 "/home/runner/work/MFC/MFC/src/common/include/parallel_macros.fpp"

! New line at end of file is required for FYPP

# 2 "/home/runner/work/MFC/MFC/src/common/include/macros.fpp" 2


# 14 "/home/runner/work/MFC/MFC/src/common/include/macros.fpp"


! Caution:

! This macro requires the use of a binding script to set CUDA_VISIBLE_DEVICES, such that we have one GPU device per MPI rank.

! That's because for both cudaMemAdvise (preferred location) and cudaMemPrefetchAsync we use location = device_id = 0.

! For an example see misc/nvidia_uvm/bind.sh.

# 63 "/home/runner/work/MFC/MFC/src/common/include/macros.fpp"


# 81 "/home/runner/work/MFC/MFC/src/common/include/macros.fpp"


# 88 "/home/runner/work/MFC/MFC/src/common/include/macros.fpp"


# 111 "/home/runner/work/MFC/MFC/src/common/include/macros.fpp"


# 127 "/home/runner/work/MFC/MFC/src/common/include/macros.fpp"


# 153 "/home/runner/work/MFC/MFC/src/common/include/macros.fpp"


# 159 "/home/runner/work/MFC/MFC/src/common/include/macros.fpp"


# 167 "/home/runner/work/MFC/MFC/src/common/include/macros.fpp"

! New line at end of file is required for FYPP

# 7 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp" 2


!> @brief MPI communication layer: domain decomposition, halo exchange, reductions, and parallel I/O setup

module m_mpi_common


#ifdef MFC_MPI

    use mpi                    !< message passing interface (mpi) module

#endif


    use m_derived_types        !< definitions of the derived types


    use m_global_parameters    !< definitions of the global parameters


    use m_helper


    use ieee_arithmetic


    use m_nvtx


    implicit none


    integer, private :: v_size


# 28 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 28 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc declare create(v_size)

# 28 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 28 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp declare target (v_size)

# 28 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

    !! Generic flags used to identify and report MPI errors


    real(wp), private, allocatable, dimension(:) :: buff_send !<

    !! This variable is utilized to pack and send the buffer of the cell-average

    !! primitive variables, for a single computational domain boundary at the

    !! time, to the relevant neighboring processor.


    real(wp), private, allocatable, dimension(:) :: buff_recv !<

    !! buff_recv is utilized to receive and unpack the buffer of the cell-

    !! average primitive variables, for a single computational domain boundary

    !! at the time, from the relevant neighboring processor.


#ifndef __NVCOMPILER_GPU_UNIFIED_MEM


# 42 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 42 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc declare create(buff_send, buff_recv)

# 42 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 42 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp declare target (buff_send, buff_recv)

# 42 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

#endif


    integer(kind=8) :: halo_size


# 46 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 46 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc declare create(halo_size)

# 46 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 46 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp declare target (halo_size)

# 46 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif


contains


    !> The computation of parameters, the allocation of memory,

        !!      the association of pointers and/or the execution of any

        !!      other procedures that are necessary to setup the module.


    impure subroutine s_initialize_mpi_common_module


#ifdef MFC_MPI

        ! Allocating buff_send/recv and. Please note that for the sake of

        ! simplicity, both variables are provided sufficient storage to hold

        ! the largest buffer in the computational domain.


        if (qbmm .and. .not. polytropic) then

            v_size = sys_size + 2*nb*4

        else

            v_size = sys_size

        end if


        if (n > 0) then

            if (p > 0) then

                halo_size = nint(-1._wp + 1._wp*buff_size*(v_size)* &

                                         & (m + 2*buff_size + 1)* &

                                         & (n + 2*buff_size + 1)* &

                                         & (p + 2*buff_size + 1)/ &

                                         & (cells_bounds%mnp_min + 2*buff_size + 1))

            else

                halo_size = -1 + buff_size*(v_size)* &

                                         & (cells_bounds%mn_max + 2*buff_size + 1)

            end if

        else

            halo_size = -1 + buff_size*(v_size)

        end if


# 81 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 81 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc update device(halo_size, v_size)

# 81 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 81 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target update to(halo_size, v_size)

# 81 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif


#ifndef __NVCOMPILER_GPU_UNIFIED_MEM

#ifdef MFC_DEBUG

# 84 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

    block

# 84 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

        use iso_fortran_env, only: output_unit

# 84 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 84 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

        print *, 'm_mpi_common.fpp:84: ', '@:ALLOCATE(buff_send(0:halo_size), buff_recv(0:halo_size))'

# 84 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 84 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

        call flush (output_unit)

# 84 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

    end block

# 84 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 84 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

    allocate (buff_send(0:halo_size), buff_recv(0:halo_size))

# 84 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 84 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 84 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 84 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 84 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc enter data create(buff_send, buff_recv)

# 84 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 84 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target enter data map(always,alloc:buff_send, buff_recv)

# 84 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

#else

        allocate (buff_send(0:halo_size), buff_recv(0:halo_size))


# 87 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 87 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc enter data create(capture:buff_send)

# 87 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 87 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target enter data map(always,alloc:capture:buff_send)

# 87 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif


# 88 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 88 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc enter data create(capture:buff_recv)

# 88 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 88 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target enter data map(always,alloc:capture:buff_recv)

# 88 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

#endif

#endif


    end subroutine s_initialize_mpi_common_module


    !> The subroutine initializes the MPI execution environment

        !!      and queries both the number of processors which will be

        !!      available for the job and the local processor rank.


    impure subroutine s_mpi_initialize


#ifdef MFC_MPI

        integer :: ierr !< Generic flag used to identify and report MPI errors


        ! Initializing the MPI environment

        call mpi_init(ierr)


        ! Checking whether the MPI environment has been properly initialized

        if (ierr /= mpi_success) then

            print '(A)', 'Unable to initialize MPI environment. Exiting.'

            call mpi_abort(mpi_comm_world, 1, ierr)

        end if


        ! Querying the number of processors available for the job

        call mpi_comm_size(mpi_comm_world, num_procs, ierr)


        ! Querying the rank of the local processor

        call mpi_comm_rank(mpi_comm_world, proc_rank, ierr)

#else

        ! Serial run only has 1 processor

        num_procs = 1

        ! Local processor rank is 0

        proc_rank = 0

#endif


    end subroutine s_mpi_initialize


    !! @param q_cons_vf Conservative variables

    !! @param ib_markers track if a cell is within the immersed boundary

    !! @param beta Eulerian void fraction from lagrangian bubbles


    impure subroutine s_initialize_mpi_data(q_cons_vf, ib_markers, beta)


        type(scalar_field), dimension(sys_size), intent(in) :: q_cons_vf

        type(integer_field), optional, intent(in) :: ib_markers

        type(scalar_field), intent(in), optional :: beta


        integer, dimension(num_dims) :: sizes_glb, sizes_loc

        integer, dimension(1) :: airfoil_glb, airfoil_loc, airfoil_start


#ifdef MFC_MPI


        ! Generic loop iterator

        integer :: i, j

        integer :: ierr !< Generic flag used to identify and report MPI errors


        !Altered system size for the lagrangian subgrid bubble model

        integer :: alt_sys


        if (present(beta)) then

            alt_sys = sys_size + 1

        else

            alt_sys = sys_size

        end if


        do i = 1, sys_size

            mpi_io_data%var(i)%sf => q_cons_vf(i)%sf(0:m, 0:n, 0:p)

        end do


        if (present(beta)) then

            mpi_io_data%var(alt_sys)%sf => beta%sf(0:m, 0:n, 0:p)

        end if


        !Additional variables pb and mv for non-polytropic qbmm

        if (qbmm .and. .not. polytropic) then

            do i = 1, nb

                do j = 1, nnode

#ifdef MFC_PRE_PROCESS

                    mpi_io_data%var(sys_size + (i - 1)*nnode + j)%sf => pb%sf(0:m, 0:n, 0:p, j, i)

                    mpi_io_data%var(sys_size + (i - 1)*nnode + j + nb*nnode)%sf => mv%sf(0:m, 0:n, 0:p, j, i)

#elif defined (MFC_SIMULATION)

                    mpi_io_data%var(sys_size + (i - 1)*nnode + j)%sf => pb_ts(1)%sf(0:m, 0:n, 0:p, j, i)

                    mpi_io_data%var(sys_size + (i - 1)*nnode + j + nb*nnode)%sf => mv_ts(1)%sf(0:m, 0:n, 0:p, j, i)

#endif

                end do

            end do

        end if


        ! Define global(g) and local(l) sizes for flow variables

        sizes_glb(1) = m_glb + 1; sizes_loc(1) = m + 1

        if (n > 0) then

            sizes_glb(2) = n_glb + 1; sizes_loc(2) = n + 1

            if (p > 0) then

                sizes_glb(num_dims) = p_glb + 1; sizes_loc(num_dims) = p + 1

            end if

        end if


        ! Define the view for each variable

        do i = 1, alt_sys

            call mpi_type_create_subarray(num_dims, sizes_glb, sizes_loc, start_idx, &

                                          mpi_order_fortran, mpi_p, mpi_io_data%view(i), ierr)

            call mpi_type_commit(mpi_io_data%view(i), ierr)

        end do


#ifndef MFC_POST_PROCESS

        if (qbmm .and. .not. polytropic) then

            do i = sys_size + 1, sys_size + 2*nb*4

                call mpi_type_create_subarray(num_dims, sizes_glb, sizes_loc, start_idx, &

                                              mpi_order_fortran, mpi_p, mpi_io_data%view(i), ierr)

                call mpi_type_commit(mpi_io_data%view(i), ierr)


            end do

        end if

#endif


#ifndef MFC_PRE_PROCESS

        if (present(ib_markers)) then

            mpi_io_ib_data%var%sf => ib_markers%sf(0:m, 0:n, 0:p)


            call mpi_type_create_subarray(num_dims, sizes_glb, sizes_loc, start_idx, &

                                          mpi_order_fortran, mpi_integer, mpi_io_ib_data%view, ierr)

            call mpi_type_commit(mpi_io_ib_data%view, ierr)

        end if

#endif


#endif


    end subroutine s_initialize_mpi_data


    !! @param q_cons_vf Conservative variables


    subroutine s_initialize_mpi_data_ds(q_cons_vf)


        type(scalar_field), &

            dimension(sys_size), &

            intent(in) :: q_cons_vf


        integer, dimension(num_dims) :: sizes_glb, sizes_loc

        integer, dimension(3) :: sf_start_idx


#ifdef MFC_MPI


        ! Generic loop iterator

        integer :: i, j, q, k, l, m_ds, n_ds, p_ds, ierr


        sf_start_idx = (/0, 0, 0/)


#ifndef MFC_POST_PROCESS

        m_ds = int((m + 1)/3) - 1

        n_ds = int((n + 1)/3) - 1

        p_ds = int((p + 1)/3) - 1

#else

        m_ds = m

        n_ds = n

        p_ds = p

#endif


#ifdef MFC_POST_PROCESS

        do i = 1, sys_size

            mpi_io_data%var(i)%sf => q_cons_vf(i)%sf(-1:m_ds + 1, -1:n_ds + 1, -1:p_ds + 1)

        end do

#endif

        ! Define global(g) and local(l) sizes for flow variables

        sizes_loc(1) = m_ds + 3

        if (n > 0) then

            sizes_loc(2) = n_ds + 3

            if (p > 0) then

                sizes_loc(num_dims) = p_ds + 3

            end if

        end if


        ! Define the view for each variable

        do i = 1, sys_size

            call mpi_type_create_subarray(num_dims, sizes_loc, sizes_loc, sf_start_idx, &

                                          mpi_order_fortran, mpi_p, mpi_io_data%view(i), ierr)

            call mpi_type_commit(mpi_io_data%view(i), ierr)

        end do

#endif


    end subroutine s_initialize_mpi_data_ds


    !> @brief Gathers variable-length real vectors from all MPI ranks onto the root process.


    impure subroutine s_mpi_gather_data(my_vector, counts, gathered_vector, root)


        integer, intent(in) :: counts          ! Array of vector lengths for each process

        real(wp), intent(in), dimension(counts) :: my_vector   ! Input vector on each process

        integer, intent(in) :: root               ! Rank of the root process

        real(wp), allocatable, intent(out) :: gathered_vector(:) ! Gathered vector on the root process


        integer :: i

        integer :: ierr !< Generic flag used to identify and report MPI errors

        integer, allocatable :: recounts(:), displs(:)


#ifdef MFC_MPI


        allocate (recounts(num_procs))


        call mpi_gather(counts, 1, mpi_integer, recounts, 1, mpi_integer, root, &

                        mpi_comm_world, ierr)


        allocate (displs(size(recounts)))


        displs(1) = 0


        do i = 2, size(recounts)

            displs(i) = displs(i - 1) + recounts(i - 1)

        end do


        allocate (gathered_vector(sum(recounts)))

        call mpi_gatherv(my_vector, counts, mpi_p, gathered_vector, recounts, displs, mpi_p, &

                         root, mpi_comm_world, ierr)

#endif


    end subroutine s_mpi_gather_data


    !> @brief Gathers per-rank time step wall-clock times onto rank 0 for performance reporting.


    impure subroutine mpi_bcast_time_step_values(proc_time, time_avg)


        real(wp), dimension(0:num_procs - 1), intent(inout) :: proc_time

        real(wp), intent(inout) :: time_avg


#ifdef MFC_MPI

        integer :: ierr !< Generic flag used to identify and report MPI errors


        call mpi_gather(time_avg, 1, mpi_p, proc_time(0), 1, mpi_p, 0, mpi_comm_world, ierr)


#endif


    end subroutine mpi_bcast_time_step_values


    !> @brief Prints a case file error with the prohibited condition and message, then aborts execution.


    impure subroutine s_prohibit_abort(condition, message)

        character(len=*), intent(in) :: condition, message


        print *, ""

        print *, "CASE FILE ERROR"

        print *, "  - Prohibited condition: ", trim(condition)

        if (len_trim(message) > 0) then

            print *, "  - Note: ", trim(message)

        end if

        print *, ""

        call s_mpi_abort(code=case_file_error_code)


    end subroutine s_prohibit_abort


    !>  The goal of this subroutine is to determine the global

        !!      extrema of the stability criteria in the computational

        !!      domain. This is performed by sifting through the local

        !!      extrema of each stability criterion. Note that each of

        !!      the local extrema is from a single process, within its

        !!      assigned section of the computational domain. Finally,

        !!      note that the global extrema values are only bookkeept

        !!      on the rank 0 processor.

        !!  @param icfl_max_loc Local maximum ICFL stability criterion

        !!  @param vcfl_max_loc Local maximum VCFL stability criterion

        !!  @param Rc_min_loc Local minimum Rc stability criterion

        !!  @param icfl_max_glb Global maximum ICFL stability criterion

        !!  @param vcfl_max_glb Global maximum VCFL stability criterion

        !!  @param Rc_min_glb Global minimum Rc stability criterion


    impure subroutine s_mpi_reduce_stability_criteria_extrema(icfl_max_loc, &

                                                              vcfl_max_loc, &

                                                              Rc_min_loc, &

                                                              icfl_max_glb, &

                                                              vcfl_max_glb, &

                                                              Rc_min_glb)


        real(wp), intent(in) :: icfl_max_loc

        real(wp), intent(in) :: vcfl_max_loc

        real(wp), intent(in) :: rc_min_loc


        real(wp), intent(out) :: icfl_max_glb

        real(wp), intent(out) :: vcfl_max_glb

        real(wp), intent(out) :: rc_min_glb


#ifdef MFC_SIMULATION

#ifdef MFC_MPI

        integer :: ierr !< Generic flag used to identify and report MPI errors


        ! Reducing local extrema of ICFL, VCFL, CCFL and Rc numbers to their

        ! global extrema and bookkeeping the results on the rank 0 processor

        call mpi_reduce(icfl_max_loc, icfl_max_glb, 1, &

                        mpi_p, mpi_max, 0, &

                        mpi_comm_world, ierr)


        if (viscous) then

            call mpi_reduce(vcfl_max_loc, vcfl_max_glb, 1, &

                            mpi_p, mpi_max, 0, &

                            mpi_comm_world, ierr)

            call mpi_reduce(rc_min_loc, rc_min_glb, 1, &

                            mpi_p, mpi_min, 0, &

                            mpi_comm_world, ierr)

        end if


#else


        icfl_max_glb = icfl_max_loc


        if (viscous) then

            vcfl_max_glb = vcfl_max_loc

            rc_min_glb = rc_min_loc

        end if


#endif

#endif


    end subroutine s_mpi_reduce_stability_criteria_extrema


    !>  The following subroutine takes the input local variable

        !!      from all processors and reduces to the sum of all

        !!      values. The reduced variable is recorded back onto the

        !!      original local variable on each processor.

        !!  @param var_loc Some variable containing the local value which should be

        !!  reduced amongst all the processors in the communicator.

        !!  @param var_glb The globally reduced value


    impure subroutine s_mpi_allreduce_sum(var_loc, var_glb)


        real(wp), intent(in) :: var_loc

        real(wp), intent(out) :: var_glb


#ifdef MFC_MPI

        integer :: ierr !< Generic flag used to identify and report MPI errors


        ! Performing the reduction procedure

        call mpi_allreduce(var_loc, var_glb, 1, mpi_p, &

                           mpi_sum, mpi_comm_world, ierr)


#endif


    end subroutine s_mpi_allreduce_sum


    !>  This subroutine follows the behavior of the s_mpi_allreduce_sum subroutine

    !>  with the additional feature that it reduces an array of vectors.


    impure subroutine s_mpi_allreduce_vectors_sum(var_loc, var_glb, num_vectors, vector_length)


        integer, intent(in) :: num_vectors, vector_length

        real(wp), dimension(:, :), intent(in) :: var_loc

        real(wp), dimension(:, :), intent(out) :: var_glb


#ifdef MFC_MPI

        integer :: ierr !< Generic flag used to identify and report MPI errors


        ! Performing the reduction procedure

        if (loc(var_loc) == loc(var_glb)) then

            call mpi_allreduce(mpi_in_place, var_glb, num_vectors*vector_length, &

                               mpi_p, mpi_sum, mpi_comm_world, ierr)

        else

            call mpi_allreduce(var_loc, var_glb, num_vectors*vector_length, &

                               mpi_p, mpi_sum, mpi_comm_world, ierr)

        end if


#else

        var_glb(1:num_vectors, 1:vector_length) = var_loc(1:num_vectors, 1:vector_length)

#endif


    end subroutine s_mpi_allreduce_vectors_sum


    !>  The following subroutine takes the input local variable

        !!      from all processors and reduces to the sum of all

        !!      values. The reduced variable is recorded back onto the

        !!      original local variable on each processor.

        !!  @param var_loc Some variable containing the local value which should be

        !!  reduced amongst all the processors in the communicator.

        !!  @param var_glb The globally reduced value


    impure subroutine s_mpi_allreduce_integer_sum(var_loc, var_glb)


        integer, intent(in) :: var_loc

        integer, intent(out) :: var_glb


#ifdef MFC_MPI

        integer :: ierr !< Generic flag used to identify and report MPI errors


        ! Performing the reduction procedure

        call mpi_allreduce(var_loc, var_glb, 1, mpi_integer, &

                           mpi_sum, mpi_comm_world, ierr)

#else

        var_glb = var_loc

#endif


    end subroutine s_mpi_allreduce_integer_sum


    !>  The following subroutine takes the input local variable

        !!      from all processors and reduces to the minimum of all

        !!      values. The reduced variable is recorded back onto the

        !!      original local variable on each processor.

        !!  @param var_loc Some variable containing the local value which should be

        !!  reduced amongst all the processors in the communicator.

        !!  @param var_glb The globally reduced value


    impure subroutine s_mpi_allreduce_min(var_loc, var_glb)


        real(wp), intent(in) :: var_loc

        real(wp), intent(out) :: var_glb


#ifdef MFC_MPI

        integer :: ierr !< Generic flag used to identify and report MPI errors


        ! Performing the reduction procedure

        call mpi_allreduce(var_loc, var_glb, 1, mpi_p, &

                           mpi_min, mpi_comm_world, ierr)


#endif


    end subroutine s_mpi_allreduce_min


    !>  The following subroutine takes the input local variable

        !!      from all processors and reduces to the maximum of all

        !!      values. The reduced variable is recorded back onto the

        !!      original local variable on each processor.

        !!  @param var_loc Some variable containing the local value which should be

        !!  reduced amongst all the processors in the communicator.

        !!  @param var_glb The globally reduced value


    impure subroutine s_mpi_allreduce_max(var_loc, var_glb)


        real(wp), intent(in) :: var_loc

        real(wp), intent(out) :: var_glb


#ifdef MFC_MPI

        integer :: ierr !< Generic flag used to identify and report MPI errors


        ! Performing the reduction procedure

        call mpi_allreduce(var_loc, var_glb, 1, mpi_p, &

                           mpi_max, mpi_comm_world, ierr)


#endif


    end subroutine s_mpi_allreduce_max


    !>  The following subroutine takes the inputted variable and

        !!      determines its minimum value on the entire computational

        !!      domain. The result is stored back into inputted variable.

        !!  @param var_loc holds the local value to be reduced among

        !!      all the processors in communicator. On output, the variable holds

        !!      the minimum value, reduced amongst all of the local values.


    impure subroutine s_mpi_reduce_min(var_loc)


        real(wp), intent(inout) :: var_loc


#ifdef MFC_MPI

        integer :: ierr !< Generic flag used to identify and report MPI errors


        ! Temporary storage variable that holds the reduced minimum value

        real(wp) :: var_glb


        ! Performing reduction procedure and eventually storing its result

        ! into the variable that was initially inputted into the subroutine

        call mpi_reduce(var_loc, var_glb, 1, mpi_p, &

                        mpi_min, 0, mpi_comm_world, ierr)


        call mpi_bcast(var_glb, 1, mpi_p, &

                       0, mpi_comm_world, ierr)


        var_loc = var_glb


#endif


    end subroutine s_mpi_reduce_min


    !>  The following subroutine takes the first element of the

        !!      2-element inputted variable and determines its maximum

        !!      value on the entire computational domain. The result is

        !!      stored back into the first element of the variable while

        !!      the rank of the processor that is in charge of the sub-

        !!      domain containing the maximum is stored into the second

        !!      element of the variable.

        !!  @param var_loc On input, this variable holds the local value and processor rank,

        !!  which are to be reduced among all the processors in communicator.

        !!  On output, this variable holds the maximum value, reduced amongst

        !!  all of the local values, and the process rank to which the value

        !!  belongs.


    impure subroutine s_mpi_reduce_maxloc(var_loc)


        real(wp), dimension(2), intent(inout) :: var_loc


#ifdef MFC_MPI

        integer :: ierr !< Generic flag used to identify and report MPI errors


        real(wp), dimension(2) :: var_glb  !<

            !! Temporary storage variable that holds the reduced maximum value

            !! and the rank of the processor with which the value is associated


        ! Performing reduction procedure and eventually storing its result

        ! into the variable that was initially inputted into the subroutine

        call mpi_reduce(var_loc, var_glb, 1, mpi_2p, &

                        mpi_maxloc, 0, mpi_comm_world, ierr)


        call mpi_bcast(var_glb, 1, mpi_2p, &

                       0, mpi_comm_world, ierr)


        var_loc = var_glb


#endif


    end subroutine s_mpi_reduce_maxloc


    !> The subroutine terminates the MPI execution environment.

        !! @param prnt error message to be printed

        !! @param code optional exit code


    impure subroutine s_mpi_abort(prnt, code)


        character(len=*), intent(in), optional :: prnt

        integer, intent(in), optional :: code


#ifdef MFC_MPI

        integer :: ierr !< Generic flag used to identify and report MPI errors

#endif


        if (present(prnt)) then

            print *, prnt

            call flush (6)


        end if


#ifndef MFC_MPI

        if (present(code)) then

            stop code

        else

            stop 1

        end if

#else

        ! Terminating the MPI environment

        if (present(code)) then

            call mpi_abort(mpi_comm_world, code, ierr)

        else

            call mpi_abort(mpi_comm_world, 1, ierr)

        end if

#endif


    end subroutine s_mpi_abort


    !>Halts all processes until all have reached barrier.


    impure subroutine s_mpi_barrier


#ifdef MFC_MPI

        integer :: ierr !< Generic flag used to identify and report MPI errors


        ! Calling MPI_BARRIER

        call mpi_barrier(mpi_comm_world, ierr)


#endif


    end subroutine s_mpi_barrier


    !> The subroutine finalizes the MPI execution environment.


    impure subroutine s_mpi_finalize


#ifdef MFC_MPI

        integer :: ierr !< Generic flag used to identify and report MPI errors


        ! Finalizing the MPI environment

        call mpi_finalize(ierr)


#endif


    end subroutine s_mpi_finalize


    !>  The goal of this procedure is to populate the buffers of

        !!      the cell-average conservative variables by communicating

        !!      with the neighboring processors.

        !!  @param q_comm Cell-average conservative variables

        !!  @param mpi_dir MPI communication coordinate direction

        !!  @param pbc_loc Processor boundary condition (PBC) location

        !!  @param nVar Number of variables to communicate

        !!  @param pb_in Optional internal bubble pressure

        !!  @param mv_in Optional bubble mass velocity


    subroutine s_mpi_sendrecv_variables_buffers(q_comm, &

                                                mpi_dir, &

                                                pbc_loc, &

                                                nVar, &

                                                pb_in, mv_in)


        type(scalar_field), dimension(1:), intent(inout) :: q_comm

        real(stp), optional, dimension(idwbuff(1)%beg:, idwbuff(2)%beg:, idwbuff(3)%beg:, 1:, 1:), intent(inout) :: pb_in, mv_in

        integer, intent(in) :: mpi_dir, pbc_loc, nVar


        integer :: i, j, k, l, r, q !< Generic loop iterators


        integer :: buffer_counts(1:3), buffer_count


        type(int_bounds_info) :: boundary_conditions(1:3)

        integer :: beg_end(1:2), grid_dims(1:3)

        integer :: dst_proc, src_proc, recv_tag, send_tag


        logical :: beg_end_geq_0, qbmm_comm


        integer :: pack_offset, unpack_offset


#ifdef MFC_MPI

        integer :: ierr !< Generic flag used to identify and report MPI errors


        call nvtxstartrange("RHS-COMM-PACKBUF")


        qbmm_comm = .false.


        if (present(pb_in) .and. present(mv_in) .and. qbmm .and. .not. polytropic) then

            qbmm_comm = .true.

            v_size = nvar + 2*nb*4

            buffer_counts = (/ &

                            buff_size*v_size*(n + 1)*(p + 1), &

                            buff_size*v_size*(m + 2*buff_size + 1)*(p + 1), &

                            buff_size*v_size*(m + 2*buff_size + 1)*(n + 2*buff_size + 1) &

                            /)

        else

            v_size = nvar

            buffer_counts = (/ &

                            buff_size*v_size*(n + 1)*(p + 1), &

                            buff_size*v_size*(m + 2*buff_size + 1)*(p + 1), &

                            buff_size*v_size*(m + 2*buff_size + 1)*(n + 2*buff_size + 1) &

                            /)

        end if


# 693 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 693 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc update device(v_size)

# 693 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 693 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target update to(v_size)

# 693 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif


        buffer_count = buffer_counts(mpi_dir)

        boundary_conditions = (/bc_x, bc_y, bc_z/)

        beg_end = (/boundary_conditions(mpi_dir)%beg, boundary_conditions(mpi_dir)%end/)

        beg_end_geq_0 = beg_end(max(pbc_loc, 0) - pbc_loc + 1) >= 0


        ! Implements:

        ! pbc_loc  bc_x >= 0 -> [send/recv]_tag  [dst/src]_proc

        ! -1 (=0)      0            ->     [1,0]       [0,0]      | 0 0 [1,0] [beg,beg]

        ! -1 (=0)      1            ->     [0,0]       [1,0]      | 0 1 [0,0] [end,beg]

        ! +1 (=1)      0            ->     [0,1]       [1,1]      | 1 0 [0,1] [end,end]

        ! +1 (=1)      1            ->     [1,1]       [0,1]      | 1 1 [1,1] [beg,end]


        send_tag = f_logical_to_int(.not. f_xor(beg_end_geq_0, pbc_loc == 1))

        recv_tag = f_logical_to_int(pbc_loc == 1)


        dst_proc = beg_end(1 + f_logical_to_int(f_xor(pbc_loc == 1, beg_end_geq_0)))

        src_proc = beg_end(1 + f_logical_to_int(pbc_loc == 1))


        grid_dims = (/m, n, p/)


        pack_offset = 0

        if (f_xor(pbc_loc == 1, beg_end_geq_0)) then

            pack_offset = grid_dims(mpi_dir) - buff_size + 1

        end if


        unpack_offset = 0

        if (pbc_loc == 1) then

            unpack_offset = grid_dims(mpi_dir) + buff_size + 1

        end if


        ! Pack Buffer to Send

# 727 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

            if (mpi_dir == 1) then

# 729 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 729 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 729 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 729 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc parallel loop collapse(4) gang vector default(present) private(r)

# 729 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 729 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 729 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 729 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 729 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target teams loop defaultmap(firstprivate:scalar) bind(teams,parallel) collapse(4) defaultmap(tofrom:aggregate) defaultmap(tofrom:allocatable) defaultmap(tofrom:pointer) private(r)

# 729 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 729 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                    do l = 0, p

                        do k = 0, n

                            do j = 0, buff_size - 1

                                do i = 1, nvar

                                    r = (i - 1) + v_size*(j + buff_size*(k + (n + 1)*l))

                                    buff_send(r) = real(q_comm(i)%sf(j + pack_offset, k, l), kind=wp)

                                end do

                            end do

                        end do

                    end do


# 740 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 740 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 740 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end parallel loop

# 740 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 740 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 740 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 740 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target teams loop

# 740 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 740 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                    if (qbmm_comm) then


# 743 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 743 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 743 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc parallel loop collapse(4) gang vector default(present) private(r)

# 743 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 743 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 743 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 743 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 743 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target teams loop defaultmap(firstprivate:scalar) bind(teams,parallel) collapse(4) defaultmap(tofrom:aggregate) defaultmap(tofrom:allocatable) defaultmap(tofrom:pointer) private(r)

# 743 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 743 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                        do l = 0, p

                            do k = 0, n

                                do j = 0, buff_size - 1

                                    do i = nvar + 1, nvar + 4

                                        do q = 1, nb

                                            r = (i - 1) + (q - 1)*4 + v_size* &

                                                (j + buff_size*(k + (n + 1)*l))

                                            buff_send(r) = real(pb_in(j + pack_offset, k, l, i - nvar, q), kind=wp)

                                        end do

                                    end do

                                end do

                            end do

                        end do


# 757 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 757 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 757 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end parallel loop

# 757 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 757 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 757 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 757 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target teams loop

# 757 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 757 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 759 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 759 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 759 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc parallel loop collapse(5) gang vector default(present) private(r)

# 759 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 759 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 759 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 759 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 759 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target teams loop defaultmap(firstprivate:scalar) bind(teams,parallel) collapse(5) defaultmap(tofrom:aggregate) defaultmap(tofrom:allocatable) defaultmap(tofrom:pointer) private(r)

# 759 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 759 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                        do l = 0, p

                            do k = 0, n

                                do j = 0, buff_size - 1

                                    do i = nvar + 1, nvar + 4

                                        do q = 1, nb

                                            r = (i - 1) + (q - 1)*4 + nb*4 + v_size* &

                                                (j + buff_size*(k + (n + 1)*l))

                                            buff_send(r) = real(mv_in(j + pack_offset, k, l, i - nvar, q), kind=wp)

                                        end do

                                    end do

                                end do

                            end do

                        end do


# 773 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 773 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 773 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end parallel loop

# 773 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 773 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 773 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 773 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target teams loop

# 773 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 773 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                    end if

# 878 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

            end if

# 727 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

            if (mpi_dir == 2) then

# 776 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 776 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 776 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 776 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc parallel loop collapse(4) gang vector default(present) private(r)

# 776 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 776 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 776 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 776 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 776 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target teams loop defaultmap(firstprivate:scalar) bind(teams,parallel) collapse(4) defaultmap(tofrom:aggregate) defaultmap(tofrom:allocatable) defaultmap(tofrom:pointer) private(r)

# 776 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 776 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                    do i = 1, nvar

                        do l = 0, p

                            do k = 0, buff_size - 1

                                do j = -buff_size, m + buff_size

                                    r = (i - 1) + v_size* &

                                        ((j + buff_size) + (m + 2*buff_size + 1)* &

                                         (k + buff_size*l))

                                    buff_send(r) = real(q_comm(i)%sf(j, k + pack_offset, l), kind=wp)

                                end do

                            end do

                        end do

                    end do


# 789 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 789 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 789 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end parallel loop

# 789 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 789 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 789 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 789 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target teams loop

# 789 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 789 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                    if (qbmm_comm) then


# 792 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 792 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 792 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc parallel loop collapse(5) gang vector default(present) private(r)

# 792 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 792 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 792 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 792 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 792 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target teams loop defaultmap(firstprivate:scalar) bind(teams,parallel) collapse(5) defaultmap(tofrom:aggregate) defaultmap(tofrom:allocatable) defaultmap(tofrom:pointer) private(r)

# 792 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 792 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                        do i = nvar + 1, nvar + 4

                            do l = 0, p

                                do k = 0, buff_size - 1

                                    do j = -buff_size, m + buff_size

                                        do q = 1, nb

                                            r = (i - 1) + (q - 1)*4 + v_size* &

                                                ((j + buff_size) + (m + 2*buff_size + 1)* &

                                                 (k + buff_size*l))

                                            buff_send(r) = real(pb_in(j, k + pack_offset, l, i - nvar, q), kind=wp)

                                        end do

                                    end do

                                end do

                            end do

                        end do


# 807 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 807 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 807 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end parallel loop

# 807 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 807 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 807 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 807 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target teams loop

# 807 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 807 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 809 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 809 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 809 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc parallel loop collapse(5) gang vector default(present) private(r)

# 809 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 809 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 809 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 809 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 809 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target teams loop defaultmap(firstprivate:scalar) bind(teams,parallel) collapse(5) defaultmap(tofrom:aggregate) defaultmap(tofrom:allocatable) defaultmap(tofrom:pointer) private(r)

# 809 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 809 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                        do i = nvar + 1, nvar + 4

                            do l = 0, p

                                do k = 0, buff_size - 1

                                    do j = -buff_size, m + buff_size

                                        do q = 1, nb

                                            r = (i - 1) + (q - 1)*4 + nb*4 + v_size* &

                                                ((j + buff_size) + (m + 2*buff_size + 1)* &

                                                 (k + buff_size*l))

                                            buff_send(r) = real(mv_in(j, k + pack_offset, l, i - nvar, q), kind=wp)

                                        end do

                                    end do

                                end do

                            end do

                        end do


# 824 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 824 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 824 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end parallel loop

# 824 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 824 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 824 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 824 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target teams loop

# 824 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 824 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                    end if

# 878 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

            end if

# 727 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

            if (mpi_dir == 3) then

# 827 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 827 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 827 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 827 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc parallel loop collapse(4) gang vector default(present) private(r)

# 827 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 827 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 827 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 827 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 827 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target teams loop defaultmap(firstprivate:scalar) bind(teams,parallel) collapse(4) defaultmap(tofrom:aggregate) defaultmap(tofrom:allocatable) defaultmap(tofrom:pointer) private(r)

# 827 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 827 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                    do i = 1, nvar

                        do l = 0, buff_size - 1

                            do k = -buff_size, n + buff_size

                                do j = -buff_size, m + buff_size

                                    r = (i - 1) + v_size* &

                                        ((j + buff_size) + (m + 2*buff_size + 1)* &

                                         ((k + buff_size) + (n + 2*buff_size + 1)*l))

                                    buff_send(r) = real(q_comm(i)%sf(j, k, l + pack_offset), kind=wp)

                                end do

                            end do

                        end do

                    end do


# 840 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 840 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 840 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end parallel loop

# 840 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 840 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 840 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 840 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target teams loop

# 840 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 840 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                    if (qbmm_comm) then


# 843 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 843 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 843 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc parallel loop collapse(5) gang vector default(present) private(r)

# 843 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 843 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 843 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 843 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 843 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target teams loop defaultmap(firstprivate:scalar) bind(teams,parallel) collapse(5) defaultmap(tofrom:aggregate) defaultmap(tofrom:allocatable) defaultmap(tofrom:pointer) private(r)

# 843 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 843 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                        do i = nvar + 1, nvar + 4

                            do l = 0, buff_size - 1

                                do k = -buff_size, n + buff_size

                                    do j = -buff_size, m + buff_size

                                        do q = 1, nb

                                            r = (i - 1) + (q - 1)*4 + v_size* &

                                                ((j + buff_size) + (m + 2*buff_size + 1)* &

                                                 ((k + buff_size) + (n + 2*buff_size + 1)*l))

                                            buff_send(r) = real(pb_in(j, k, l + pack_offset, i - nvar, q), kind=wp)

                                        end do

                                    end do

                                end do

                            end do

                        end do


# 858 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 858 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 858 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end parallel loop

# 858 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 858 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 858 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 858 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target teams loop

# 858 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 858 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 860 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 860 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 860 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc parallel loop collapse(5) gang vector default(present) private(r)

# 860 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 860 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 860 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 860 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 860 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target teams loop defaultmap(firstprivate:scalar) bind(teams,parallel) collapse(5) defaultmap(tofrom:aggregate) defaultmap(tofrom:allocatable) defaultmap(tofrom:pointer) private(r)

# 860 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 860 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                        do i = nvar + 1, nvar + 4

                            do l = 0, buff_size - 1

                                do k = -buff_size, n + buff_size

                                    do j = -buff_size, m + buff_size

                                        do q = 1, nb

                                            r = (i - 1) + (q - 1)*4 + nb*4 + v_size* &

                                                ((j + buff_size) + (m + 2*buff_size + 1)* &

                                                 ((k + buff_size) + (n + 2*buff_size + 1)*l))

                                            buff_send(r) = real(mv_in(j, k, l + pack_offset, i - nvar, q), kind=wp)

                                        end do

                                    end do

                                end do

                            end do

                        end do


# 875 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 875 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 875 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end parallel loop

# 875 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 875 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 875 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 875 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target teams loop

# 875 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 875 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                    end if

# 878 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

            end if

# 880 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

        call nvtxendrange ! Packbuf


        ! Send/Recv

#ifdef MFC_SIMULATION

# 885 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

            if (rdma_mpi .eqv. .false.) then

# 900 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                    call nvtxstartrange("RHS-COMM-DEV2HOST")


# 901 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 901 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc update host(buff_send)

# 901 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 901 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target update from(buff_send)

# 901 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

                    call nvtxendrange

                    call nvtxstartrange("RHS-COMM-SENDRECV-NO-RMDA")


                    call mpi_sendrecv( &

                        buff_send, buffer_count, mpi_p, dst_proc, send_tag, &

                        buff_recv, buffer_count, mpi_p, src_proc, recv_tag, &

                        mpi_comm_world, mpi_status_ignore, ierr)


                    call nvtxendrange ! RHS-MPI-SENDRECV-(NO)-RDMA


                    call nvtxstartrange("RHS-COMM-HOST2DEV")


# 913 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 913 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc update device(buff_recv)

# 913 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 913 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target update to(buff_recv)

# 913 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

                    call nvtxendrange

# 916 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

            end if

# 885 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

            if (rdma_mpi .eqv. .true.) then

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc host_data use_device(buff_send, buff_recv)

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                        call nvtxstartrange("RHS-COMM-SENDRECV-RDMA")

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                        call mpi_sendrecv( &

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                            buff_send, buffer_count, mpi_p, dst_proc, send_tag, &

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                            buff_recv, buffer_count, mpi_p, src_proc, recv_tag, &

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                            mpi_comm_world, mpi_status_ignore, ierr)

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                        call nvtxendrange ! RHS-MPI-SENDRECV-(NO)-RDMA

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end host_data

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target data use_device_addr(buff_send, buff_recv)

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                        call nvtxstartrange("RHS-COMM-SENDRECV-RDMA")

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                        call mpi_sendrecv( &

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                            buff_send, buffer_count, mpi_p, dst_proc, send_tag, &

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                            buff_recv, buffer_count, mpi_p, src_proc, recv_tag, &

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                            mpi_comm_world, mpi_status_ignore, ierr)

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                        call nvtxendrange ! RHS-MPI-SENDRECV-(NO)-RDMA

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target data

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#else

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                        call nvtxstartrange("RHS-COMM-SENDRECV-RDMA")

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                        call mpi_sendrecv( &

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                            buff_send, buffer_count, mpi_p, dst_proc, send_tag, &

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                            buff_recv, buffer_count, mpi_p, src_proc, recv_tag, &

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                            mpi_comm_world, mpi_status_ignore, ierr)

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                        call nvtxendrange ! RHS-MPI-SENDRECV-(NO)-RDMA

# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 887 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 898 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 898 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 898 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc wait

# 898 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 898 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp barrier

# 898 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 916 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

            end if

# 918 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#else

        call mpi_sendrecv( &

            buff_send, buffer_count, mpi_p, dst_proc, send_tag, &

            buff_recv, buffer_count, mpi_p, src_proc, recv_tag, &

            mpi_comm_world, mpi_status_ignore, ierr)

#endif


        ! Unpack Received Buffer

        call nvtxstartrange("RHS-COMM-UNPACKBUF")

# 928 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

            if (mpi_dir == 1) then

# 930 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 930 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 930 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 930 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc parallel loop collapse(4) gang vector default(present) private(r)

# 930 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 930 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 930 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 930 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 930 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target teams loop defaultmap(firstprivate:scalar) bind(teams,parallel) collapse(4) defaultmap(tofrom:aggregate) defaultmap(tofrom:allocatable) defaultmap(tofrom:pointer) private(r)

# 930 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 930 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                    do l = 0, p

                        do k = 0, n

                            do j = -buff_size, -1

                                do i = 1, nvar

                                    r = (i - 1) + v_size* &

                                        (j + buff_size*((k + 1) + (n + 1)*l))

                                    q_comm(i)%sf(j + unpack_offset, k, l) = real(buff_recv(r), kind=stp)

#if defined(__INTEL_COMPILER)

                                    if (ieee_is_nan(q_comm(i)%sf(j + unpack_offset, k, l))) then

                                        print *, "Error", j, k, l, i

                                        call s_mpi_abort("NaN(s) in recv")

                                    end if

#endif

                                end do

                            end do

                        end do

                    end do


# 948 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 948 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 948 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end parallel loop

# 948 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 948 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 948 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 948 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target teams loop

# 948 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 948 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                    if (qbmm_comm) then


# 951 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 951 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 951 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc parallel loop collapse(5) gang vector default(present) private(r)

# 951 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 951 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 951 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 951 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 951 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target teams loop defaultmap(firstprivate:scalar) bind(teams,parallel) collapse(5) defaultmap(tofrom:aggregate) defaultmap(tofrom:allocatable) defaultmap(tofrom:pointer) private(r)

# 951 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 951 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                        do l = 0, p

                            do k = 0, n

                                do j = -buff_size, -1

                                    do i = nvar + 1, nvar + 4

                                        do q = 1, nb

                                            r = (i - 1) + (q - 1)*4 + v_size* &

                                                (j + buff_size*((k + 1) + (n + 1)*l))

                                            pb_in(j + unpack_offset, k, l, i - nvar, q) = real(buff_recv(r), kind=stp)

                                        end do

                                    end do

                                end do

                            end do

                        end do


# 965 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 965 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 965 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end parallel loop

# 965 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 965 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 965 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 965 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target teams loop

# 965 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 965 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 967 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 967 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 967 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc parallel loop collapse(5) gang vector default(present) private(r)

# 967 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 967 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 967 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 967 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 967 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target teams loop defaultmap(firstprivate:scalar) bind(teams,parallel) collapse(5) defaultmap(tofrom:aggregate) defaultmap(tofrom:allocatable) defaultmap(tofrom:pointer) private(r)

# 967 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 967 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                        do l = 0, p

                            do k = 0, n

                                do j = -buff_size, -1

                                    do i = nvar + 1, nvar + 4

                                        do q = 1, nb

                                            r = (i - 1) + (q - 1)*4 + nb*4 + v_size* &

                                                (j + buff_size*((k + 1) + (n + 1)*l))

                                            mv_in(j + unpack_offset, k, l, i - nvar, q) = real(buff_recv(r), kind=stp)

                                        end do

                                    end do

                                end do

                            end do

                        end do


# 981 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 981 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 981 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end parallel loop

# 981 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 981 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 981 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 981 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target teams loop

# 981 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 981 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                    end if

# 1102 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

            end if

# 928 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

            if (mpi_dir == 2) then

# 984 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 984 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 984 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 984 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc parallel loop collapse(4) gang vector default(present) private(r)

# 984 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 984 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 984 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 984 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 984 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target teams loop defaultmap(firstprivate:scalar) bind(teams,parallel) collapse(4) defaultmap(tofrom:aggregate) defaultmap(tofrom:allocatable) defaultmap(tofrom:pointer) private(r)

# 984 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 984 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                    do i = 1, nvar

                        do l = 0, p

                            do k = -buff_size, -1

                                do j = -buff_size, m + buff_size

                                    r = (i - 1) + v_size* &

                                        ((j + buff_size) + (m + 2*buff_size + 1)* &

                                         ((k + buff_size) + buff_size*l))

                                    q_comm(i)%sf(j, k + unpack_offset, l) = real(buff_recv(r), kind=stp)

#if defined(__INTEL_COMPILER)

                                    if (ieee_is_nan(q_comm(i)%sf(j, k + unpack_offset, l))) then

                                        print *, "Error", j, k, l, i

                                        call s_mpi_abort("NaN(s) in recv")

                                    end if

#endif

                                end do

                            end do

                        end do

                    end do


# 1003 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1003 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 1003 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end parallel loop

# 1003 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 1003 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1003 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1003 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target teams loop

# 1003 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 1003 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                    if (qbmm_comm) then


# 1006 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1006 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 1006 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc parallel loop collapse(5) gang vector default(present) private(r)

# 1006 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 1006 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1006 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1006 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1006 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target teams loop defaultmap(firstprivate:scalar) bind(teams,parallel) collapse(5) defaultmap(tofrom:aggregate) defaultmap(tofrom:allocatable) defaultmap(tofrom:pointer) private(r)

# 1006 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 1006 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                        do i = nvar + 1, nvar + 4

                            do l = 0, p

                                do k = -buff_size, -1

                                    do j = -buff_size, m + buff_size

                                        do q = 1, nb

                                            r = (i - 1) + (q - 1)*4 + v_size* &

                                                ((j + buff_size) + (m + 2*buff_size + 1)* &

                                                 ((k + buff_size) + buff_size*l))

                                            pb_in(j, k + unpack_offset, l, i - nvar, q) = real(buff_recv(r), kind=stp)

                                        end do

                                    end do

                                end do

                            end do

                        end do


# 1021 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1021 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 1021 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end parallel loop

# 1021 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 1021 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1021 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1021 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target teams loop

# 1021 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 1021 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1023 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1023 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 1023 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc parallel loop collapse(5) gang vector default(present) private(r)

# 1023 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 1023 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1023 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1023 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1023 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target teams loop defaultmap(firstprivate:scalar) bind(teams,parallel) collapse(5) defaultmap(tofrom:aggregate) defaultmap(tofrom:allocatable) defaultmap(tofrom:pointer) private(r)

# 1023 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 1023 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                        do i = nvar + 1, nvar + 4

                            do l = 0, p

                                do k = -buff_size, -1

                                    do j = -buff_size, m + buff_size

                                        do q = 1, nb

                                            r = (i - 1) + (q - 1)*4 + nb*4 + v_size* &

                                                ((j + buff_size) + (m + 2*buff_size + 1)* &

                                                 ((k + buff_size) + buff_size*l))

                                            mv_in(j, k + unpack_offset, l, i - nvar, q) = real(buff_recv(r), kind=stp)

                                        end do

                                    end do

                                end do

                            end do

                        end do


# 1038 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1038 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 1038 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end parallel loop

# 1038 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 1038 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1038 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1038 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target teams loop

# 1038 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 1038 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                    end if

# 1102 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

            end if

# 928 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

            if (mpi_dir == 3) then

# 1041 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

                    ! Unpacking buffer from bc_z%beg


# 1042 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1042 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 1042 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc parallel loop collapse(4) gang vector default(present) private(r)

# 1042 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 1042 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1042 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1042 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1042 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target teams loop defaultmap(firstprivate:scalar) bind(teams,parallel) collapse(4) defaultmap(tofrom:aggregate) defaultmap(tofrom:allocatable) defaultmap(tofrom:pointer) private(r)

# 1042 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 1042 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                    do i = 1, nvar

                        do l = -buff_size, -1

                            do k = -buff_size, n + buff_size

                                do j = -buff_size, m + buff_size

                                    r = (i - 1) + v_size* &

                                        ((j + buff_size) + (m + 2*buff_size + 1)* &

                                         ((k + buff_size) + (n + 2*buff_size + 1)* &

                                          (l + buff_size)))

                                    q_comm(i)%sf(j, k, l + unpack_offset) = real(buff_recv(r), kind=stp)

#if defined(__INTEL_COMPILER)

                                    if (ieee_is_nan(q_comm(i)%sf(j, k, l + unpack_offset))) then

                                        print *, "Error", j, k, l, i

                                        call s_mpi_abort("NaN(s) in recv")

                                    end if

#endif

                                end do

                            end do

                        end do

                    end do


# 1062 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1062 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 1062 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end parallel loop

# 1062 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 1062 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1062 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1062 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target teams loop

# 1062 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 1062 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                    if (qbmm_comm) then


# 1065 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1065 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 1065 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc parallel loop collapse(5) gang vector default(present) private(r)

# 1065 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 1065 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1065 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1065 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1065 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target teams loop defaultmap(firstprivate:scalar) bind(teams,parallel) collapse(5) defaultmap(tofrom:aggregate) defaultmap(tofrom:allocatable) defaultmap(tofrom:pointer) private(r)

# 1065 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 1065 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                        do i = nvar + 1, nvar + 4

                            do l = -buff_size, -1

                                do k = -buff_size, n + buff_size

                                    do j = -buff_size, m + buff_size

                                        do q = 1, nb

                                            r = (i - 1) + (q - 1)*4 + v_size* &

                                                ((j + buff_size) + (m + 2*buff_size + 1)* &

                                                 ((k + buff_size) + (n + 2*buff_size + 1)* &

                                                  (l + buff_size)))

                                            pb_in(j, k, l + unpack_offset, i - nvar, q) = real(buff_recv(r), kind=stp)

                                        end do

                                    end do

                                end do

                            end do

                        end do


# 1081 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1081 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 1081 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end parallel loop

# 1081 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 1081 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1081 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1081 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target teams loop

# 1081 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 1081 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1083 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1083 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 1083 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc parallel loop collapse(5) gang vector default(present) private(r)

# 1083 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 1083 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1083 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1083 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1083 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp target teams loop defaultmap(firstprivate:scalar) bind(teams,parallel) collapse(5) defaultmap(tofrom:aggregate) defaultmap(tofrom:allocatable) defaultmap(tofrom:pointer) private(r)

# 1083 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 1083 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                        do i = nvar + 1, nvar + 4

                            do l = -buff_size, -1

                                do k = -buff_size, n + buff_size

                                    do j = -buff_size, m + buff_size

                                        do q = 1, nb

                                            r = (i - 1) + (q - 1)*4 + nb*4 + v_size* &

                                                ((j + buff_size) + (m + 2*buff_size + 1)* &

                                                 ((k + buff_size) + (n + 2*buff_size + 1)* &

                                                  (l + buff_size)))

                                            mv_in(j, k, l + unpack_offset, i - nvar, q) = real(buff_recv(r), kind=stp)

                                        end do

                                    end do

                                end do

                            end do

                        end do


# 1099 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1099 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#if defined(MFC_OpenACC)

# 1099 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$acc end parallel loop

# 1099 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#elif defined(MFC_OpenMP)

# 1099 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1099 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


# 1099 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

!$omp end target teams loop

# 1099 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

#endif

# 1099 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"


                    end if

# 1102 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

            end if

# 1104 "/home/runner/work/MFC/MFC/src/common/m_mpi_common.fpp"

        call nvtxendrange

#endif


    end subroutine s_mpi_sendrecv_variables_buffers


    !>  The purpose of this procedure is to optimally decompose

        !!      the computational domain among the available processors.

        !!      This is performed by attempting to award each processor,

        !!      in each of the coordinate directions, approximately the

        !!      same number of cells, and then recomputing the affected

        !!      global parameters.


    subroutine s_mpi_decompose_computational_domain


#ifdef MFC_MPI


        integer :: num_procs_x, num_procs_y, num_procs_z !<

            !! Optimal number of processors in the x-, y- and z-directions


        real(wp) :: tmp_num_procs_x, tmp_num_procs_y, tmp_num_procs_z !<

            !! Non-optimal number of processors in the x-, y- and z-directions


        real(wp) :: fct_min !<

            !! Processor factorization (fct) minimization parameter


        integer :: MPI_COMM_CART !<

            !! Cartesian processor topology communicator


        integer :: rem_cells !<

            !! Remaining number of cells, in a particular coordinate direction,

            !! after the majority is divided up among the available processors


        integer :: recon_order !<

            !! WENO or MUSCL reconstruction order


        integer :: i, j !< Generic loop iterators

        integer :: ierr !< Generic flag used to identify and report MPI errors


        if (recon_type == weno_type) then

            recon_order = weno_order

        else

            recon_order = muscl_order

        end if


        if (num_procs == 1 .and. parallel_io) then

            do i = 1, num_dims

                start_idx(i) = 0

            end do

            return

        end if


        if (igr) then

            recon_order = igr_order

        end if


        ! 3D Cartesian Processor Topology

        if (n > 0) then


            if (p > 0) then

                if (fft_wrt) then


                    ! Initial estimate of optimal processor topology

                    num_procs_x = 1

                    num_procs_y = 1

                    num_procs_z = num_procs

                    ierr = -1


                    ! Benchmarking the quality of this initial guess

                    tmp_num_procs_y = num_procs_y

                    tmp_num_procs_z = num_procs_z

                    fct_min = 10._wp*abs((n + 1)/tmp_num_procs_y &

                                         - (p + 1)/tmp_num_procs_z)


                    ! Optimization of the initial processor topology

                    do i = 1, num_procs


                        if (mod(num_procs, i) == 0 &

                            .and. &

                            (n + 1)/i >= num_stcls_min*recon_order) then


                            tmp_num_procs_y = i

                            tmp_num_procs_z = num_procs/i


                            if (fct_min >= abs((n + 1)/tmp_num_procs_y &

                                               - (p + 1)/tmp_num_procs_z) &

                                .and. &

                                (p + 1)/tmp_num_procs_z &

                                >= &

                                num_stcls_min*recon_order) then


                                num_procs_y = i

                                num_procs_z = num_procs/i

                                fct_min = abs((n + 1)/tmp_num_procs_y &

                                              - (p + 1)/tmp_num_procs_z)

                                ierr = 0


                            end if


                        end if


                    end do

                else


                    if (cyl_coord .and. p > 0) then

                        ! Implement pencil processor blocking if using cylindrical coordinates so

                        ! that all cells in azimuthal direction are stored on a single processor.

                        ! This is necessary for efficient application of Fourier filter near axis.


                        ! Initial values of the processor factorization optimization

                        num_procs_x = 1

                        num_procs_y = num_procs

                        num_procs_z = 1

                        ierr = -1


                        ! Computing minimization variable for these initial values

                        tmp_num_procs_x = num_procs_x

                        tmp_num_procs_y = num_procs_y

                        tmp_num_procs_z = num_procs_z

                        fct_min = 10._wp*abs((m + 1)/tmp_num_procs_x &

                                             - (n + 1)/tmp_num_procs_y)


                        ! Searching for optimal computational domain distribution

                        do i = 1, num_procs


                            if (mod(num_procs, i) == 0 &

                                .and. &

                                (m + 1)/i >= num_stcls_min*recon_order) then


                                tmp_num_procs_x = i

                                tmp_num_procs_y = num_procs/i


                                if (fct_min >= abs((m + 1)/tmp_num_procs_x &

                                                   - (n + 1)/tmp_num_procs_y) &

                                    .and. &

                                    (n + 1)/tmp_num_procs_y &

                                    >= &

                                    num_stcls_min*recon_order) then


                                    num_procs_x = i

                                    num_procs_y = num_procs/i

                                    fct_min = abs((m + 1)/tmp_num_procs_x &

                                                  - (n + 1)/tmp_num_procs_y)

                                    ierr = 0


                                end if


                            end if


                        end do


                    else


                        ! Initial estimate of optimal processor topology

                        num_procs_x = 1

                        num_procs_y = 1

                        num_procs_z = num_procs

                        ierr = -1


                        ! Benchmarking the quality of this initial guess

                        tmp_num_procs_x = num_procs_x

                        tmp_num_procs_y = num_procs_y

                        tmp_num_procs_z = num_procs_z

                        fct_min = 10._wp*abs((m + 1)/tmp_num_procs_x &

                                             - (n + 1)/tmp_num_procs_y) &

                                  + 10._wp*abs((n + 1)/tmp_num_procs_y &

                                               - (p + 1)/tmp_num_procs_z)


                        ! Optimization of the initial processor topology

                        do i = 1, num_procs


                            if (mod(num_procs, i) == 0 &

                                .and. &

                                (m + 1)/i >= num_stcls_min*recon_order) then


                                do j = 1, num_procs/i


                                    if (mod(num_procs/i, j) == 0 &

                                        .and. &

                                        (n + 1)/j >= num_stcls_min*recon_order) then


                                        tmp_num_procs_x = i

                                        tmp_num_procs_y = j

                                        tmp_num_procs_z = num_procs/(i*j)


                                        if (fct_min >= abs((m + 1)/tmp_num_procs_x &

                                                           - (n + 1)/tmp_num_procs_y) &

                                            + abs((n + 1)/tmp_num_procs_y &

                                                  - (p + 1)/tmp_num_procs_z) &

                                            .and. &

                                            (p + 1)/tmp_num_procs_z &

                                            >= &

                                            num_stcls_min*recon_order) &

                                            then


                                            num_procs_x = i

                                            num_procs_y = j

                                            num_procs_z = num_procs/(i*j)

                                            fct_min = abs((m + 1)/tmp_num_procs_x &

                                                          - (n + 1)/tmp_num_procs_y) &

                                                      + abs((n + 1)/tmp_num_procs_y &

                                                            - (p + 1)/tmp_num_procs_z)

                                            ierr = 0


                                        end if


                                    end if


                                end do


                            end if


                        end do


                    end if

                end if


                ! Verifying that a valid decomposition of the computational

                ! domain has been established. If not, the simulation exits.

                if (proc_rank == 0 .and. ierr == -1) then

                    call s_mpi_abort('Unsupported combination of values '// &

                                     'of num_procs, m, n, p and '// &

                                     'weno/muscl/igr_order. Exiting.')

                end if


                ! Creating new communicator using the Cartesian topology

                call mpi_cart_create(mpi_comm_world, 3, (/num_procs_x, &

                                                          num_procs_y, num_procs_z/), &

                                     (/.true., .true., .true./), &

                                     .false., mpi_comm_cart, ierr)


                ! Finding the Cartesian coordinates of the local process

                call mpi_cart_coords(mpi_comm_cart, proc_rank, 3, &

                                     proc_coords, ierr)

                ! END: 3D Cartesian Processor Topology


                ! Global Parameters for z-direction


                ! Number of remaining cells

                rem_cells = mod(p + 1, num_procs_z)


                ! Optimal number of cells per processor

                p = (p + 1)/num_procs_z - 1


                ! Distributing the remaining cells

                do i = 1, rem_cells

                    if (proc_coords(3) == i - 1) then

                        p = p + 1; exit

                    end if

                end do


                ! Boundary condition at the beginning

                if (proc_coords(3) > 0 .or. (bc_z%beg == bc_periodic .and. num_procs_z > 1)) then

                    proc_coords(3) = proc_coords(3) - 1

                    call mpi_cart_rank(mpi_comm_cart, proc_coords, &

                                       bc_z%beg, ierr)

                    proc_coords(3) = proc_coords(3) + 1

                end if


                ! Boundary condition at the end

                if (proc_coords(3) < num_procs_z - 1 .or. (bc_z%end == bc_periodic .and. num_procs_z > 1)) then

                    proc_coords(3) = proc_coords(3) + 1

                    call mpi_cart_rank(mpi_comm_cart, proc_coords, &

                                       bc_z%end, ierr)

                    proc_coords(3) = proc_coords(3) - 1

                end if


#ifdef MFC_POST_PROCESS

                ! Ghost zone at the beginning

                if (proc_coords(3) > 0 .and. format == 1) then

                    offset_z%beg = 2

                else

                    offset_z%beg = 0

                end if


                ! Ghost zone at the end

                if (proc_coords(3) < num_procs_z - 1 .and. format == 1) then

                    offset_z%end = 2

                else

                    offset_z%end = 0

                end if

#endif


                ! Beginning and end sub-domain boundary locations

                if (parallel_io) then

                    if (proc_coords(3) < rem_cells) then

                        start_idx(3) = (p + 1)*proc_coords(3)

                    else

                        start_idx(3) = (p + 1)*proc_coords(3) + rem_cells

                    end if

                else

#ifdef MFC_PRE_PROCESS

                    if (old_grid .neqv. .true.) then

                        dz = (z_domain%end - z_domain%beg)/real(p_glb + 1, wp)


                        if (proc_coords(3) < rem_cells) then

                            z_domain%beg = z_domain%beg + dz*real((p + 1)* &

                                                                  proc_coords(3))

                            z_domain%end = z_domain%end - dz*real((p + 1)* &

                                                                  (num_procs_z - proc_coords(3) - 1) &

                                                                  - (num_procs_z - rem_cells))

                        else

                            z_domain%beg = z_domain%beg + dz*real((p + 1)* &

                                                                  proc_coords(3) + rem_cells)

                            z_domain%end = z_domain%end - dz*real((p + 1)* &

                                                                  (num_procs_z - proc_coords(3) - 1))

                        end if

                    end if

#endif

                end if


                ! 2D Cartesian Processor Topology

            else


                ! Initial estimate of optimal processor topology

                num_procs_x = 1

                num_procs_y = num_procs

                ierr = -1


                ! Benchmarking the quality of this initial guess

                tmp_num_procs_x = num_procs_x

                tmp_num_procs_y = num_procs_y

                fct_min = 10._wp*abs((m + 1)/tmp_num_procs_x &

                                     - (n + 1)/tmp_num_procs_y)


                ! Optimization of the initial processor topology

                do i = 1, num_procs


                    if (mod(num_procs, i) == 0 &

                        .and. &

                        (m + 1)/i >= num_stcls_min*recon_order) then


                        tmp_num_procs_x = i

                        tmp_num_procs_y = num_procs/i


                        if (fct_min >= abs((m + 1)/tmp_num_procs_x &

                                           - (n + 1)/tmp_num_procs_y) &

                            .and. &

                            (n + 1)/tmp_num_procs_y &

                            >= &

                            num_stcls_min*recon_order) then


                            num_procs_x = i

                            num_procs_y = num_procs/i

                            fct_min = abs((m + 1)/tmp_num_procs_x &

                                          - (n + 1)/tmp_num_procs_y)

                            ierr = 0


                        end if


                    end if


                end do


                ! Verifying that a valid decomposition of the computational

                ! domain has been established. If not, the simulation exits.

                if (proc_rank == 0 .and. ierr == -1) then

                    call s_mpi_abort('Unsupported combination of values '// &

                                     'of num_procs, m, n and '// &

                                     'weno/muscl/igr_order. Exiting.')

                end if


                ! Creating new communicator using the Cartesian topology

                call mpi_cart_create(mpi_comm_world, 2, (/num_procs_x, &

                                                          num_procs_y/), (/.true., &

                                                                           .true./), .false., mpi_comm_cart, &

                                     ierr)


                ! Finding the Cartesian coordinates of the local process

                call mpi_cart_coords(mpi_comm_cart, proc_rank, 2, &

                                     proc_coords, ierr)


            end if

            ! END: 2D Cartesian Processor Topology


            ! Global Parameters for y-direction


            ! Number of remaining cells

            rem_cells = mod(n + 1, num_procs_y)


            ! Optimal number of cells per processor

            n = (n + 1)/num_procs_y - 1


            ! Distributing the remaining cells

            do i = 1, rem_cells

                if (proc_coords(2) == i - 1) then

                    n = n + 1; exit

                end if

            end do


            ! Boundary condition at the beginning

            if (proc_coords(2) > 0 .or. (bc_y%beg == bc_periodic .and. num_procs_y > 1)) then

                proc_coords(2) = proc_coords(2) - 1

                call mpi_cart_rank(mpi_comm_cart, proc_coords, &

                                   bc_y%beg, ierr)

                proc_coords(2) = proc_coords(2) + 1

            end if


            ! Boundary condition at the end

            if (proc_coords(2) < num_procs_y - 1 .or. (bc_y%end == bc_periodic .and. num_procs_y > 1)) then

                proc_coords(2) = proc_coords(2) + 1

                call mpi_cart_rank(mpi_comm_cart, proc_coords, &

                                   bc_y%end, ierr)

                proc_coords(2) = proc_coords(2) - 1

            end if


#ifdef MFC_POST_PROCESS

            ! Ghost zone at the beginning

            if (proc_coords(2) > 0 .and. format == 1) then

                offset_y%beg = 2

            else

                offset_y%beg = 0

            end if


            ! Ghost zone at the end

            if (proc_coords(2) < num_procs_y - 1 .and. format == 1) then

                offset_y%end = 2

            else

                offset_y%end = 0

            end if

#endif


            ! Beginning and end sub-domain boundary locations

            if (parallel_io) then

                if (proc_coords(2) < rem_cells) then

                    start_idx(2) = (n + 1)*proc_coords(2)

                else

                    start_idx(2) = (n + 1)*proc_coords(2) + rem_cells

                end if

            else

#ifdef MFC_PRE_PROCESS

                if (old_grid .neqv. .true.) then

                    dy = (y_domain%end - y_domain%beg)/real(n_glb + 1, wp)


                    if (proc_coords(2) < rem_cells) then

                        y_domain%beg = y_domain%beg + dy*real((n + 1)* &

                                                              proc_coords(2))

                        y_domain%end = y_domain%end - dy*real((n + 1)* &

                                                              (num_procs_y - proc_coords(2) - 1) &

                                                              - (num_procs_y - rem_cells))

                    else

                        y_domain%beg = y_domain%beg + dy*real((n + 1)* &

                                                              proc_coords(2) + rem_cells)

                        y_domain%end = y_domain%end - dy*real((n + 1)* &

                                                              (num_procs_y - proc_coords(2) - 1))

                    end if

                end if

#endif

            end if


            ! 1D Cartesian Processor Topology

        else


            ! Optimal processor topology

            num_procs_x = num_procs


            ! Creating new communicator using the Cartesian topology

            call mpi_cart_create(mpi_comm_world, 1, (/num_procs_x/), &

                                 (/.true./), .false., mpi_comm_cart, &

                                 ierr)


            ! Finding the Cartesian coordinates of the local process

            call mpi_cart_coords(mpi_comm_cart, proc_rank, 1, &

                                 proc_coords, ierr)


        end if


        ! Global Parameters for x-direction


        ! Number of remaining cells

        rem_cells = mod(m + 1, num_procs_x)


        ! Optimal number of cells per processor

        m = (m + 1)/num_procs_x - 1


        ! Distributing the remaining cells

        do i = 1, rem_cells

            if (proc_coords(1) == i - 1) then

                m = m + 1; exit

            end if

        end do


        call s_update_cell_bounds(cells_bounds, m, n, p)


        ! Boundary condition at the beginning

        if (proc_coords(1) > 0 .or. (bc_x%beg == bc_periodic .and. num_procs_x > 1)) then

            proc_coords(1) = proc_coords(1) - 1

            call mpi_cart_rank(mpi_comm_cart, proc_coords, bc_x%beg, ierr)

            proc_coords(1) = proc_coords(1) + 1

        end if


        ! Boundary condition at the end

        if (proc_coords(1) < num_procs_x - 1 .or. (bc_x%end == bc_periodic .and. num_procs_x > 1)) then

            proc_coords(1) = proc_coords(1) + 1

            call mpi_cart_rank(mpi_comm_cart, proc_coords, bc_x%end, ierr)

            proc_coords(1) = proc_coords(1) - 1

        end if


#ifdef MFC_POST_PROCESS

        ! Ghost zone at the beginning

        if (proc_coords(1) > 0 .and. format == 1) then

            offset_x%beg = 2

        else

            offset_x%beg = 0

        end if


        ! Ghost zone at the end

        if (proc_coords(1) < num_procs_x - 1 .and. format == 1) then

            offset_x%end = 2

        else

            offset_x%end = 0

        end if

#endif


        ! Beginning and end sub-domain boundary locations

        if (parallel_io) then

            if (proc_coords(1) < rem_cells) then

                start_idx(1) = (m + 1)*proc_coords(1)

            else

                start_idx(1) = (m + 1)*proc_coords(1) + rem_cells

            end if

        else

#ifdef MFC_PRE_PROCESS

            if (old_grid .neqv. .true.) then

                dx = (x_domain%end - x_domain%beg)/real(m_glb + 1, wp)


                if (proc_coords(1) < rem_cells) then

                    x_domain%beg = x_domain%beg + dx*real((m + 1)* &

                                                          proc_coords(1))

                    x_domain%end = x_domain%end - dx*real((m + 1)* &

                                                          (num_procs_x - proc_coords(1) - 1) &

                                                          - (num_procs_x - rem_cells))

                else

                    x_domain%beg = x_domain%beg + dx*real((m + 1)* &

                                                          proc_coords(1) + rem_cells)

                    x_domain%end = x_domain%end - dx*real((m + 1)* &

                                                          (num_procs_x - proc_coords(1) - 1))

                end if

            end if

#endif

        end if

#endif


    end subroutine s_mpi_decompose_computational_domain


    !>  The goal of this procedure is to populate the buffers of

        !!      the grid variables by communicating with the neighboring

        !!      processors. Note that only the buffers of the cell-width

        !!      distributions are handled in such a way. This is because

        !!      the buffers of cell-boundary locations may be calculated

        !!      directly from those of the cell-width distributions.

        !!  @param mpi_dir MPI communication coordinate direction

        !!  @param pbc_loc Processor boundary condition (PBC) location

#ifndef MFC_PRE_PROCESS


    subroutine s_mpi_sendrecv_grid_variables_buffers(mpi_dir, pbc_loc)


        integer, intent(in) :: mpi_dir

        integer, intent(in) :: pbc_loc


#ifdef MFC_MPI

        integer :: ierr !< Generic flag used to identify and report MPI errors


        ! MPI Communication in x-direction

        if (mpi_dir == 1) then


            if (pbc_loc == -1) then      ! PBC at the beginning


                if (bc_x%end >= 0) then      ! PBC at the beginning and end


                    ! Send/receive buffer to/from bc_x%end/bc_x%beg

                    call mpi_sendrecv( &

                        dx(m - buff_size + 1), buff_size, &

                        mpi_p, bc_x%end, 0, &

                        dx(-buff_size), buff_size, &

                        mpi_p, bc_x%beg, 0, &

                        mpi_comm_world, mpi_status_ignore, ierr)


                else                        ! PBC at the beginning only


                    ! Send/receive buffer to/from bc_x%beg/bc_x%beg

                    call mpi_sendrecv( &

                        dx(0), buff_size, &

                        mpi_p, bc_x%beg, 1, &

                        dx(-buff_size), buff_size, &

                        mpi_p, bc_x%beg, 0, &

                        mpi_comm_world, mpi_status_ignore, ierr)


                end if


            else                        ! PBC at the end


                if (bc_x%beg >= 0) then      ! PBC at the end and beginning


                    ! Send/receive buffer to/from bc_x%beg/bc_x%end

                    call mpi_sendrecv( &

                        dx(0), buff_size, &

                        mpi_p, bc_x%beg, 1, &

                        dx(m + 1), buff_size, &

                        mpi_p, bc_x%end, 1, &

                        mpi_comm_world, mpi_status_ignore, ierr)


                else                        ! PBC at the end only


                    ! Send/receive buffer to/from bc_x%end/bc_x%end

                    call mpi_sendrecv( &

                        dx(m - buff_size + 1), buff_size, &

                        mpi_p, bc_x%end, 0, &

                        dx(m + 1), buff_size, &

                        mpi_p, bc_x%end, 1, &

                        mpi_comm_world, mpi_status_ignore, ierr)


                end if


            end if

            ! END: MPI Communication in x-direction


            ! MPI Communication in y-direction

        elseif (mpi_dir == 2) then


            if (pbc_loc == -1) then      ! PBC at the beginning


                if (bc_y%end >= 0) then      ! PBC at the beginning and end


                    ! Send/receive buffer to/from bc_y%end/bc_y%beg

                    call mpi_sendrecv( &

                        dy(n - buff_size + 1), buff_size, &

                        mpi_p, bc_y%end, 0, &

                        dy(-buff_size), buff_size, &

                        mpi_p, bc_y%beg, 0, &

                        mpi_comm_world, mpi_status_ignore, ierr)


                else                        ! PBC at the beginning only


                    ! Send/receive buffer to/from bc_y%beg/bc_y%beg

                    call mpi_sendrecv( &

                        dy(0), buff_size, &

                        mpi_p, bc_y%beg, 1, &

                        dy(-buff_size), buff_size, &

                        mpi_p, bc_y%beg, 0, &

                        mpi_comm_world, mpi_status_ignore, ierr)


                end if


            else                        ! PBC at the end


                if (bc_y%beg >= 0) then      ! PBC at the end and beginning


                    ! Send/receive buffer to/from bc_y%beg/bc_y%end

                    call mpi_sendrecv( &

                        dy(0), buff_size, &

                        mpi_p, bc_y%beg, 1, &

                        dy(n + 1), buff_size, &

                        mpi_p, bc_y%end, 1, &

                        mpi_comm_world, mpi_status_ignore, ierr)


                else                        ! PBC at the end only


                    ! Send/receive buffer to/from bc_y%end/bc_y%end

                    call mpi_sendrecv( &

                        dy(n - buff_size + 1), buff_size, &

                        mpi_p, bc_y%end, 0, &

                        dy(n + 1), buff_size, &

                        mpi_p, bc_y%end, 1, &

                        mpi_comm_world, mpi_status_ignore, ierr)


                end if


            end if

            ! END: MPI Communication in y-direction


            ! MPI Communication in z-direction

        else


            if (pbc_loc == -1) then      ! PBC at the beginning


                if (bc_z%end >= 0) then      ! PBC at the beginning and end


                    ! Send/receive buffer to/from bc_z%end/bc_z%beg

                    call mpi_sendrecv( &

                        dz(p - buff_size + 1), buff_size, &

                        mpi_p, bc_z%end, 0, &

                        dz(-buff_size), buff_size, &

                        mpi_p, bc_z%beg, 0, &

                        mpi_comm_world, mpi_status_ignore, ierr)


                else                        ! PBC at the beginning only


                    ! Send/receive buffer to/from bc_z%beg/bc_z%beg

                    call mpi_sendrecv( &

                        dz(0), buff_size, &

                        mpi_p, bc_z%beg, 1, &

                        dz(-buff_size), buff_size, &

                        mpi_p, bc_z%beg, 0, &

                        mpi_comm_world, mpi_status_ignore, ierr)


                end if


            else                        ! PBC at the end


                if (bc_z%beg >= 0) then      ! PBC at the end and beginning


                    ! Send/receive buffer to/from bc_z%beg/bc_z%end

                    call mpi_sendrecv( &

                        dz(0), buff_size, &

                        mpi_p, bc_z%beg, 1, &

                        dz(p + 1), buff_size, &

                        mpi_p, bc_z%end, 1, &

                        mpi_comm_world, mpi_status_ignore, ierr)


                else                        ! PBC at the end only


                    ! Send/receive buffer to/from bc_z%end/bc_z%end

                    call mpi_sendrecv( &

                        dz(p - buff_size + 1), buff_size, &

                        mpi_p, bc_z%end, 0, &

                        dz(p + 1), buff_size, &

                        mpi_p, bc_z%end, 1, &

                        mpi_comm_world, mpi_status_ignore, ierr)


                end if


            end if


        end if

        ! END: MPI Communication in z-direction

#endif


    end subroutine s_mpi_sendrecv_grid_variables_buffers

#endif


    !> Module deallocation and/or disassociation procedures


    impure subroutine s_finalize_mpi_common_module


#ifdef MFC_MPI

        deallocate (buff_send, buff_recv)

#endif


    end subroutine s_finalize_mpi_common_module


end module m_mpi_common

q_cons_vf
type(scalar_field), dimension(sys_size), intent(inout) q_cons_vf
Definition m_phase_change.fpp.f90:1180

j
integer, intent(in) j
Definition m_phase_change.fpp.f90:1182

m_derived_types
Shared derived types for field data, patch geometry, bubble dynamics, and MPI I/O structures.
Definition m_derived_types.fpp.f90:294

m_global_parameters
Defines global parameters for the computational domain, simulation algorithm, and initial conditions.
Definition m_global_parameters.fpp.f90:19

m_global_parameters::sys_size
integer sys_size
Number of unknowns in the system of equations.
Definition m_global_parameters.fpp.f90:97

m_global_parameters::buff_size
integer buff_size
The number of cells that are necessary to be able to store enough boundary conditions data to march t...
Definition m_global_parameters.fpp.f90:304

m_global_parameters::polytropic
logical polytropic
Definition m_global_parameters.fpp.f90:261

m_global_parameters::qbmm
logical qbmm
Quadrature moment method.
Definition m_global_parameters.fpp.f90:237

m_global_parameters::p
integer p
Definition m_global_parameters.fpp.f90:50

m_global_parameters::n
integer n
Definition m_global_parameters.fpp.f90:49

m_global_parameters::cells_bounds
type(cell_num_bounds) cells_bounds
Definition m_global_parameters.fpp.f90:53

m_global_parameters::nb
integer nb
Definition m_global_parameters.fpp.f90:233

m_global_parameters::m
integer m
Definition m_global_parameters.fpp.f90:48

m_helper
Utility routines for bubble model setup, coordinate transforms, array sampling, and special functions...
Definition m_helper.fpp.f90:305

m_mpi_common
MPI communication layer: domain decomposition, halo exchange, reductions, and parallel I/O setup.
Definition m_mpi_common.fpp.f90:305

m_mpi_common::s_mpi_abort
impure subroutine s_mpi_abort(prnt, code)
The subroutine terminates the MPI execution environment.
Definition m_mpi_common.fpp.f90:971

m_mpi_common::s_initialize_mpi_common_module
impure subroutine s_initialize_mpi_common_module
The computation of parameters, the allocation of memory, the association of pointers and/or the execu...
Definition m_mpi_common.fpp.f90:380

m_mpi_common::s_mpi_gather_data
impure subroutine s_mpi_gather_data(my_vector, counts, gathered_vector, root)
Gathers variable-length real vectors from all MPI ranks onto the root process.
Definition m_mpi_common.fpp.f90:659

m_mpi_common::s_mpi_barrier
impure subroutine s_mpi_barrier
Halts all processes until all have reached barrier.
Definition m_mpi_common.fpp.f90:1004

m_mpi_common::s_mpi_initialize
impure subroutine s_mpi_initialize
The subroutine initializes the MPI execution environment and queries both the number of processors wh...
Definition m_mpi_common.fpp.f90:488

m_mpi_common::s_mpi_allreduce_vectors_sum
impure subroutine s_mpi_allreduce_vectors_sum(var_loc, var_glb, num_vectors, vector_length)
This subroutine follows the behavior of the s_mpi_allreduce_sum subroutine with the additional featur...
Definition m_mpi_common.fpp.f90:807

m_mpi_common::buff_recv
real(wp), dimension(:), allocatable, private buff_recv
buff_recv is utilized to receive and unpack the buffer of the cell- average primitive variables,...
Definition m_mpi_common.fpp.f90:342

m_mpi_common::s_initialize_mpi_data
impure subroutine s_initialize_mpi_data(q_cons_vf, ib_markers, beta)
Definition m_mpi_common.fpp.f90:519

m_mpi_common::s_mpi_reduce_maxloc
impure subroutine s_mpi_reduce_maxloc(var_loc)
The following subroutine takes the first element of the 2-element inputted variable and determines it...
Definition m_mpi_common.fpp.f90:943

m_mpi_common::s_mpi_sendrecv_grid_variables_buffers
subroutine s_mpi_sendrecv_grid_variables_buffers(mpi_dir, pbc_loc)
The goal of this procedure is to populate the buffers of the grid variables by communicating with the...
Definition m_mpi_common.fpp.f90:2854

m_mpi_common::s_mpi_reduce_stability_criteria_extrema
impure subroutine s_mpi_reduce_stability_criteria_extrema(icfl_max_loc, vcfl_max_loc, rc_min_loc, icfl_max_glb, vcfl_max_glb, rc_min_glb)
The goal of this subroutine is to determine the global extrema of the stability criteria in the compu...
Definition m_mpi_common.fpp.f90:739

m_mpi_common::s_mpi_allreduce_sum
impure subroutine s_mpi_allreduce_sum(var_loc, var_glb)
The following subroutine takes the input local variable from all processors and reduces to the sum of...
Definition m_mpi_common.fpp.f90:789

m_mpi_common::buff_send
real(wp), dimension(:), allocatable, private buff_send
This variable is utilized to pack and send the buffer of the cell-average primitive variables,...
Definition m_mpi_common.fpp.f90:337

m_mpi_common::s_mpi_allreduce_min
impure subroutine s_mpi_allreduce_min(var_loc, var_glb)
The following subroutine takes the input local variable from all processors and reduces to the minimu...
Definition m_mpi_common.fpp.f90:862

m_mpi_common::s_mpi_sendrecv_variables_buffers
subroutine s_mpi_sendrecv_variables_buffers(q_comm, mpi_dir, pbc_loc, nvar, pb_in, mv_in)
The goal of this procedure is to populate the buffers of the cell-average conservative variables by c...
Definition m_mpi_common.fpp.f90:1042

m_mpi_common::s_prohibit_abort
impure subroutine s_prohibit_abort(condition, message)
Prints a case file error with the prohibited condition and message, then aborts execution.
Definition m_mpi_common.fpp.f90:707

m_mpi_common::s_mpi_finalize
impure subroutine s_mpi_finalize
The subroutine finalizes the MPI execution environment.
Definition m_mpi_common.fpp.f90:1017

m_mpi_common::s_initialize_mpi_data_ds
subroutine s_initialize_mpi_data_ds(q_cons_vf)
Definition m_mpi_common.fpp.f90:608

m_mpi_common::s_mpi_allreduce_max
impure subroutine s_mpi_allreduce_max(var_loc, var_glb)
The following subroutine takes the input local variable from all processors and reduces to the maximu...
Definition m_mpi_common.fpp.f90:885

m_mpi_common::s_mpi_allreduce_integer_sum
impure subroutine s_mpi_allreduce_integer_sum(var_loc, var_glb)
The following subroutine takes the input local variable from all processors and reduces to the sum of...
Definition m_mpi_common.fpp.f90:838

m_mpi_common::v_size
integer, private v_size
Definition m_mpi_common.fpp.f90:323

m_mpi_common::mpi_bcast_time_step_values
impure subroutine mpi_bcast_time_step_values(proc_time, time_avg)
Gathers per-rank time step wall-clock times onto rank 0 for performance reporting.
Definition m_mpi_common.fpp.f90:692

m_mpi_common::s_mpi_reduce_min
impure subroutine s_mpi_reduce_min(var_loc)
The following subroutine takes the inputted variable and determines its minimum value on the entire c...
Definition m_mpi_common.fpp.f90:907

m_mpi_common::s_finalize_mpi_common_module
impure subroutine s_finalize_mpi_common_module
Module deallocation and/or disassociation procedures.
Definition m_mpi_common.fpp.f90:3031

m_mpi_common::halo_size
integer(kind=8) halo_size
Definition m_mpi_common.fpp.f90:361

m_mpi_common::s_mpi_decompose_computational_domain
subroutine s_mpi_decompose_computational_domain
The purpose of this procedure is to optimally decompose the computational domain among the available ...
Definition m_mpi_common.fpp.f90:2313

m_nvtx
NVIDIA NVTX profiling API bindings for GPU performance instrumentation.
Definition m_nvtx.f90:6