AliceO2Group
diff --git a/‎GPU/Common/GPUCommonDefAPI.h‎
Lines changed: 2 additions & 0 deletions b/‎GPU/Common/GPUCommonDefAPI.h‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎GPU/Common/GPUDef.h‎
Lines changed: 4 additions & 4 deletions b/‎GPU/Common/GPUDef.h‎
Lines changed: 4 additions & 4 deletions
diff --git a/‎GPU/GPUTracking/Base/GPUGeneralKernels.cxx‎
Lines changed: 1 addition & 1 deletion b/‎GPU/GPUTracking/Base/GPUGeneralKernels.cxx‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎GPU/GPUTracking/DataCompression/GPUTPCCompressionKernels.cxx‎
Lines changed: 15 additions & 15 deletions b/‎GPU/GPUTracking/DataCompression/GPUTPCCompressionKernels.cxx‎
Lines changed: 15 additions & 15 deletions
diff --git a/‎GPU/GPUTracking/DataCompression/GPUTPCCompressionKernels.h‎
Lines changed: 1 addition & 1 deletion b/‎GPU/GPUTracking/DataCompression/GPUTPCCompressionKernels.h‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎GPU/GPUTracking/DataCompression/GPUTPCCompressionTrackModel.cxx‎
Lines changed: 1 addition & 1 deletion b/‎GPU/GPUTracking/DataCompression/GPUTPCCompressionTrackModel.cxx‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎GPU/GPUTracking/ITS/GPUITSFitterKernels.cxx‎
Lines changed: 3 additions & 3 deletions b/‎GPU/GPUTracking/ITS/GPUITSFitterKernels.cxx‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎GPU/GPUTracking/Merger/GPUTPCGMMergerGPU.cxx‎
Lines changed: 1 addition & 1 deletion b/‎GPU/GPUTracking/Merger/GPUTPCGMMergerGPU.cxx‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎GPU/GPUTracking/Merger/GPUTPCGMPhysicalTrackModel.cxx‎
Lines changed: 3 additions & 3 deletions b/‎GPU/GPUTracking/Merger/GPUTPCGMPhysicalTrackModel.cxx‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎GPU/GPUTracking/Merger/GPUTPCGMPhysicalTrackModel.h‎
Lines changed: 1 addition & 1 deletion b/‎GPU/GPUTracking/Merger/GPUTPCGMPhysicalTrackModel.h‎
Lines changed: 1 addition & 1 deletion
@@ -177,6 +177,8 @@
 #define GPUconstexprref()
 #endif
 
+#define GPUrestrict() // We don't use restrict at the moment, could try at a later time
+
 // Macros for GRID dimension
 #if defined(__CUDACC__) || defined(__HIPCC__)
   #define get_global_id(dim) (blockIdx.x * blockDim.x + threadIdx.x)
 
@@ -37,7 +37,7 @@
 #endif
 
 #ifdef GPUCA_GPUCODE
-  #define CA_MAKE_SHARED_REF(vartype, varname, varglobal, varshared) const GPUsharedref() MEM_LOCAL(vartype) &varname = varshared;
+  #define CA_MAKE_SHARED_REF(vartype, varname, varglobal, varshared) const GPUsharedref() MEM_LOCAL(vartype) & __restrict__ varname = varshared;
   #define CA_SHARED_STORAGE(storage) storage
   #define CA_SHARED_CACHE(target, src, size) \
     static_assert((size) % sizeof(int) == 0, "Invalid shared cache size"); \
@@ -46,12 +46,12 @@
     }
   #define CA_SHARED_CACHE_REF(target, src, size, reftype, ref) \
     CA_SHARED_CACHE(target, src, size) \
-    GPUsharedref() const reftype* ref = (target)
+    GPUsharedref() const reftype* __restrict__ ref = (target)
 #else
-  #define CA_MAKE_SHARED_REF(vartype, varname, varglobal, varshared) const GPUglobalref() MEM_GLOBAL(vartype) &varname = varglobal;
+  #define CA_MAKE_SHARED_REF(vartype, varname, varglobal, varshared) const GPUglobalref() MEM_GLOBAL(vartype) & __restrict__ varname = varglobal;
   #define CA_SHARED_STORAGE(storage)
   #define CA_SHARED_CACHE(target, src, size)
-  #define CA_SHARED_CACHE_REF(target, src, size, reftype, ref) GPUglobalref() const reftype* ref = src
+  #define CA_SHARED_CACHE_REF(target, src, size, reftype, ref) GPUglobalref() const reftype* __restrict__ ref = src
 #endif
 
 #ifdef GPUCA_TEXTURE_FETCH_CONSTRUCTOR
 
@@ -15,7 +15,7 @@
 using namespace GPUCA_NAMESPACE::gpu;
 
 template <>
-GPUdii() void GPUMemClean16::Thread<0>(int nBlocks, int nThreads, int iBlock, int iThread, GPUsharedref() MEM_LOCAL(GPUSharedMemory) & smem, processorType& processors, GPUglobalref() void* ptr, unsigned long size)
+GPUdii() void GPUMemClean16::Thread<0>(int nBlocks, int nThreads, int iBlock, int iThread, GPUsharedref() MEM_LOCAL(GPUSharedMemory) & GPUrestrict() smem, processorType& GPUrestrict() processors, GPUglobalref() void* ptr, unsigned long size)
 {
   const unsigned long stride = get_global_size(0);
   int4 i0;
 
@@ -26,25 +26,25 @@ using namespace o2::tpc;
 template <>
 GPUdii() void GPUTPCCompressionKernels::Thread<GPUTPCCompressionKernels::step0attached>(int nBlocks, int nThreads, int iBlock, int iThread, GPUsharedref() GPUSharedMemory& smem, processorType& processors)
 {
-  GPUTPCGMMerger& merger = processors.tpcMerger;
-  const o2::tpc::ClusterNativeAccess* clusters = processors.tpcConverter.getClustersNative();
-  GPUTPCCompression& compressor = processors.tpcCompressor;
-  GPUParam& param = processors.param;
+  const GPUTPCGMMerger& GPUrestrict() merger = processors.tpcMerger;
+  const o2::tpc::ClusterNativeAccess* GPUrestrict() clusters = processors.tpcConverter.getClustersNative();
+  GPUTPCCompression& GPUrestrict() compressor = processors.tpcCompressor;
+  const GPUParam& GPUrestrict() param = processors.param;
 
   char lastLeg = 0;
   int myTrack = 0;
   for (unsigned int i = get_global_id(0); i < (unsigned int)merger.NOutputTracks(); i += get_global_size(0)) {
-    const GPUTPCGMMergedTrack& trk = merger.OutputTracks()[i];
+    const GPUTPCGMMergedTrack& GPUrestrict() trk = merger.OutputTracks()[i];
     if (!trk.OK()) {
       continue;
     }
     bool rejectTrk = CAMath::Abs(trk.GetParam().GetQPt()) > processors.param.rec.tpcRejectQPt;
     int nClustersStored = 0;
-    CompressedClustersPtrsOnly& c = compressor.mPtrs;
+    CompressedClustersPtrsOnly& GPUrestrict() c = compressor.mPtrs;
     unsigned int lastRow = 0, lastSlice = 0; // BUG: These should be unsigned char, but then CUDA breaks
     GPUTPCCompressionTrackModel track;
     for (int k = trk.NClusters() - 1; k >= 0; k--) {
-      const GPUTPCGMMergedTrackHit& hit = merger.Clusters()[trk.FirstClusterRef() + k];
+      const GPUTPCGMMergedTrackHit& GPUrestrict() hit = merger.Clusters()[trk.FirstClusterRef() + k];
       if (hit.state & GPUTPCGMMergedTrackHit::flagReject) {
         continue;
       }
@@ -63,7 +63,7 @@ GPUdii() void GPUTPCCompressionKernels::Thread<GPUTPCCompressionKernels::step0at
       if (!(param.rec.tpcCompressionModes & GPUSettings::CompressionTrackModel)) {
         continue; // No track model compression
       }
-      const ClusterNative& orgCl = clusters->clusters[hit.slice][hit.row][hit.num - clusters->clusterOffset[hit.slice][hit.row]];
+      const ClusterNative& GPUrestrict() orgCl = clusters->clusters[hit.slice][hit.row][hit.num - clusters->clusterOffset[hit.slice][hit.row]];
       float x = param.tpcGeometry.Row2X(hit.row);
       float y = param.tpcGeometry.LinearPad2Y(hit.slice, hit.row, orgCl.getPad());
       float z = param.tpcGeometry.LinearTime2Z(hit.slice, orgCl.getTime());
@@ -168,12 +168,12 @@ GPUd() bool GPUTPCCompressionKernels::GPUTPCCompressionKernels_Compare<3>::opera
 }
 
 template <>
-GPUdii() void GPUTPCCompressionKernels::Thread<GPUTPCCompressionKernels::step1unattached>(int nBlocks, int nThreads, int iBlock, int iThread, GPUsharedref() GPUSharedMemory& smem, processorType& processors)
+GPUdii() void GPUTPCCompressionKernels::Thread<GPUTPCCompressionKernels::step1unattached>(int nBlocks, int nThreads, int iBlock, int iThread, GPUsharedref() GPUSharedMemory& GPUrestrict() smem, processorType& GPUrestrict() processors)
 {
-  GPUTPCGMMerger& merger = processors.tpcMerger;
-  const o2::tpc::ClusterNativeAccess* clusters = processors.tpcConverter.getClustersNative();
-  GPUTPCCompression& compressor = processors.tpcCompressor;
-  GPUParam& param = processors.param;
+  const GPUTPCGMMerger& GPUrestrict() merger = processors.tpcMerger;
+  const o2::tpc::ClusterNativeAccess* GPUrestrict() clusters = processors.tpcConverter.getClustersNative();
+  GPUTPCCompression& GPUrestrict() compressor = processors.tpcCompressor;
+  GPUParam& GPUrestrict() param = processors.param;
   unsigned int* sortBuffer = compressor.mClusterSortBuffer + iBlock * compressor.mNMaxClusterSliceRow;
   for (int iSliceRow = iBlock; iSliceRow < GPUCA_NSLICES * GPUCA_ROW_COUNT; iSliceRow += nBlocks) {
     const int iSlice = iSliceRow / GPUCA_ROW_COUNT;
@@ -184,7 +184,7 @@ GPUdii() void GPUTPCCompressionKernels::Thread<GPUTPCCompressionKernels::step1un
     }
     GPUbarrier();
 
-    CompressedClustersPtrsOnly& c = compressor.mPtrs;
+    CompressedClustersPtrsOnly& GPUrestrict() c = compressor.mPtrs;
     for (unsigned int i = get_local_id(0); i < clusters->nClusters[iSlice][iRow]; i += get_local_size(0)) {
       const int idx = idOffset + i;
       if (compressor.mClusterStatus[idx]) {
@@ -231,7 +231,7 @@ GPUdii() void GPUTPCCompressionKernels::Thread<GPUTPCCompressionKernels::step1un
     unsigned short lastPad = 0;
     for (unsigned int i = 0; i < smem.nCount; i++) {
       int cidx = idOffset + i;
-      const ClusterNative& orgCl = clusters->clusters[iSlice][iRow][sortBuffer[i]];
+      const ClusterNative& GPUrestrict() orgCl = clusters->clusters[iSlice][iRow][sortBuffer[i]];
       c.padDiffU[cidx] = orgCl.padPacked - lastPad;
       c.timeDiffU[cidx] = (orgCl.getTimePacked() - lastTime) & 0xFFFFFF;
       if (param.rec.tpcCompressionModes & GPUSettings::CompressionDifferences) {
 
@@ -43,7 +43,7 @@ class GPUTPCCompressionKernels : public GPUKernelTemplate
   };
 
   template <int iKernel = defaultKernel>
-  GPUd() static void Thread(int nBlocks, int nThreads, int iBlock, int iThread, GPUsharedref() GPUSharedMemory& smem, processorType& processors);
+  GPUd() static void Thread(int nBlocks, int nThreads, int iBlock, int iThread, GPUsharedref() GPUSharedMemory& GPUrestrict() smem, processorType& GPUrestrict() processors);
 
  public:
   template <int I>
 
@@ -22,7 +22,7 @@ using namespace GPUCA_NAMESPACE::gpu;
 // encoded with the old version!!!
 
 #ifdef GPUCA_COMPRESSION_TRACK_MODEL_MERGER
-GPUd() void GPUTPCCompressionTrackModel::Init(float x, float y, float z, float alpha, unsigned char qPt, const GPUParam& param)
+GPUd() void GPUTPCCompressionTrackModel::Init(float x, float y, float z, float alpha, unsigned char qPt, const GPUParam& GPUrestrict() param)
 {
   static constexpr float kRho = 1.025e-3f;  // 0.9e-3;
   static constexpr float kRadLen = 29.532f; // 28.94;
 
@@ -29,13 +29,13 @@ using namespace GPUCA_NAMESPACE::gpu;
 using namespace o2;
 using namespace o2::its;
 
-GPUdii() bool GPUITSFitterKernel::fitTrack(GPUITSFitter& Fitter, GPUTPCGMPropagator& prop, GPUITSTrack& track, int start, int end, int step)
+GPUdii() bool GPUITSFitterKernel::fitTrack(GPUITSFitter& GPUrestrict() Fitter, GPUTPCGMPropagator& GPUrestrict() prop, GPUITSTrack& GPUrestrict() track, int start, int end, int step)
 {
   for (int iLayer{start}; iLayer != end; iLayer += step) {
     if (track.mClusters[iLayer] == o2::its::constants::its::UnusedIndex) {
       continue;
     }
-    const TrackingFrameInfo& trackingHit = Fitter.trackingFrame()[iLayer][track.mClusters[iLayer]];
+    const TrackingFrameInfo& GPUrestrict() trackingHit = Fitter.trackingFrame()[iLayer][track.mClusters[iLayer]];
 
     if (prop.PropagateToXAlpha(trackingHit.xTrackingFrame, trackingHit.alphaTrackingFrame, step > 0)) {
       return false;
@@ -55,7 +55,7 @@ GPUdii() bool GPUITSFitterKernel::fitTrack(GPUITSFitter& Fitter, GPUTPCGMPropaga
 }
 
 template <>
-GPUdii() void GPUITSFitterKernel::Thread<0>(int nBlocks, int nThreads, int iBlock, int iThread, GPUsharedref() GPUSharedMemory& smem, processorType& processors)
+GPUdii() void GPUITSFitterKernel::Thread<0>(int nBlocks, int nThreads, int iBlock, int iThread, GPUsharedref() GPUSharedMemory& GPUrestrict() smem, processorType& GPUrestrict() processors)
 {
   GPUITSFitter& Fitter = processors.itsFitter;
 
 
@@ -19,7 +19,7 @@
 using namespace GPUCA_NAMESPACE::gpu;
 
 template <>
-GPUdii() void GPUTPCGMMergerTrackFit::Thread<0>(int nBlocks, int nThreads, int iBlock, int iThread, GPUsharedref() GPUSharedMemory& smem, processorType& merger)
+GPUdii() void GPUTPCGMMergerTrackFit::Thread<0>(int nBlocks, int nThreads, int iBlock, int iThread, GPUsharedref() GPUSharedMemory& GPUrestrict() smem, processorType& GPUrestrict() merger)
 {
 #if defined(WITH_OPENMP) && !defined(GPUCA_GPUCODE)
 #pragma omp parallel for num_threads(merger.GetRec().GetDeviceProcessingSettings().nThreads)
 
@@ -16,7 +16,7 @@
 
 using namespace GPUCA_NAMESPACE::gpu;
 
-GPUd() int GPUTPCGMPhysicalTrackModel::PropagateToXBzLight(float x, float Bz, float& dLp)
+GPUd() int GPUTPCGMPhysicalTrackModel::PropagateToXBzLight(float x, float Bz, float& GPUrestrict() dLp)
 {
   GPUTPCGMPhysicalTrackModel t = *this;
   if (CAMath::Abs(x - t.X()) < 1.e-8f) {
@@ -31,7 +31,7 @@ GPUd() int GPUTPCGMPhysicalTrackModel::PropagateToXBzLight(float x, float Bz, fl
   return 0;
 }
 
-GPUd() int GPUTPCGMPhysicalTrackModel::PropagateToXBzLightNoUpdate(float x, float Bz, float& dLp)
+GPUd() int GPUTPCGMPhysicalTrackModel::PropagateToXBzLightNoUpdate(float x, float Bz, float& GPUrestrict() dLp)
 {
   //
   // transport the track to X=x in magnetic field B = ( 0, 0, Bz[kG*0.000299792458] )
@@ -85,7 +85,7 @@ GPUd() int GPUTPCGMPhysicalTrackModel::PropagateToXBzLightNoUpdate(float x, floa
   return 0;
 }
 
-GPUd() int GPUTPCGMPhysicalTrackModel::PropagateToXBxByBz(float x, float Bx, float By, float Bz, float& dLp)
+GPUd() int GPUTPCGMPhysicalTrackModel::PropagateToXBxByBz(float x, float Bx, float By, float Bz, float& GPUrestrict() dLp)
 {
   //
   // transport the track to X=x in magnetic field B = ( Bx, By, Bz )[kG*0.000299792458]
 
@@ -164,7 +164,7 @@ class GPUTPCGMPhysicalTrackModel
 
 GPUdi() GPUTPCGMPhysicalTrackModel::GPUTPCGMPhysicalTrackModel(const GPUTPCGMTrackParam& t) { Set(t); }
 
-GPUdi() void GPUTPCGMPhysicalTrackModel::Set(const GPUTPCGMTrackParam& t)
+GPUdi() void GPUTPCGMPhysicalTrackModel::Set(const GPUTPCGMTrackParam& GPUrestrict() t)
 {
   float pti = CAMath::Abs(t.GetQPt());
   if (pti < 1.e-4f) {
Original file line number	Diff line number	Diff line change
`@@ -15,7 +15,7 @@`
`15`	`15`	`using namespace GPUCA_NAMESPACE::gpu;`
`16`	`16`
`17`	`17`	`template <>`
`18`		`-GPUdii() void GPUMemClean16::Thread<0>(int nBlocks, int nThreads, int iBlock, int iThread, GPUsharedref() MEM_LOCAL(GPUSharedMemory) & smem, processorType& processors, GPUglobalref() void* ptr, unsigned long size)`
	`18`	`+GPUdii() void GPUMemClean16::Thread<0>(int nBlocks, int nThreads, int iBlock, int iThread, GPUsharedref() MEM_LOCAL(GPUSharedMemory) & GPUrestrict() smem, processorType& GPUrestrict() processors, GPUglobalref() void* ptr, unsigned long size)`
`19`	`19`	`{`
`20`	`20`	`const unsigned long stride = get_global_size(0);`
`21`	`21`	`int4 i0;`
Original file line number	Diff line number	Diff line change
`@@ -22,7 +22,7 @@ using namespace GPUCA_NAMESPACE::gpu;`
`22`	`22`	`// encoded with the old version!!!`
`23`	`23`
`24`	`24`	`#ifdef GPUCA_COMPRESSION_TRACK_MODEL_MERGER`
`25`		`-GPUd() void GPUTPCCompressionTrackModel::Init(float x, float y, float z, float alpha, unsigned char qPt, const GPUParam& param)`
	`25`	`+GPUd() void GPUTPCCompressionTrackModel::Init(float x, float y, float z, float alpha, unsigned char qPt, const GPUParam& GPUrestrict() param)`
`26`	`26`	`{`
`27`	`27`	`static constexpr float kRho = 1.025e-3f; // 0.9e-3;`
`28`	`28`	`static constexpr float kRadLen = 29.532f; // 28.94;`
Original file line number	Diff line number	Diff line change
`@@ -29,13 +29,13 @@ using namespace GPUCA_NAMESPACE::gpu;`
`29`	`29`	`using namespace o2;`
`30`	`30`	`using namespace o2::its;`
`31`	`31`
`32`		`-GPUdii() bool GPUITSFitterKernel::fitTrack(GPUITSFitter& Fitter, GPUTPCGMPropagator& prop, GPUITSTrack& track, int start, int end, int step)`
	`32`	`+GPUdii() bool GPUITSFitterKernel::fitTrack(GPUITSFitter& GPUrestrict() Fitter, GPUTPCGMPropagator& GPUrestrict() prop, GPUITSTrack& GPUrestrict() track, int start, int end, int step)`
`33`	`33`	`{`
`34`	`34`	`for (int iLayer{start}; iLayer != end; iLayer += step) {`
`35`	`35`	`if (track.mClusters[iLayer] == o2::its::constants::its::UnusedIndex) {`
`36`	`36`	`continue;`
`37`	`37`	`}`
`38`		`- const TrackingFrameInfo& trackingHit = Fitter.trackingFrame()[iLayer][track.mClusters[iLayer]];`
	`38`	`+ const TrackingFrameInfo& GPUrestrict() trackingHit = Fitter.trackingFrame()[iLayer][track.mClusters[iLayer]];`
`39`	`39`
`40`	`40`	`if (prop.PropagateToXAlpha(trackingHit.xTrackingFrame, trackingHit.alphaTrackingFrame, step > 0)) {`
`41`	`41`	`return false;`
`@@ -55,7 +55,7 @@ GPUdii() bool GPUITSFitterKernel::fitTrack(GPUITSFitter& Fitter, GPUTPCGMPropaga`
`55`	`55`	`}`
`56`	`56`
`57`	`57`	`template <>`
`58`		`-GPUdii() void GPUITSFitterKernel::Thread<0>(int nBlocks, int nThreads, int iBlock, int iThread, GPUsharedref() GPUSharedMemory& smem, processorType& processors)`
	`58`	`+GPUdii() void GPUITSFitterKernel::Thread<0>(int nBlocks, int nThreads, int iBlock, int iThread, GPUsharedref() GPUSharedMemory& GPUrestrict() smem, processorType& GPUrestrict() processors)`
`59`	`59`	`{`
`60`	`60`	`GPUITSFitter& Fitter = processors.itsFitter;`
`61`	`61`
Original file line number	Diff line number	Diff line change
`@@ -19,7 +19,7 @@`
`19`	`19`	`using namespace GPUCA_NAMESPACE::gpu;`
`20`	`20`
`21`	`21`	`template <>`
`22`		`-GPUdii() void GPUTPCGMMergerTrackFit::Thread<0>(int nBlocks, int nThreads, int iBlock, int iThread, GPUsharedref() GPUSharedMemory& smem, processorType& merger)`
	`22`	`+GPUdii() void GPUTPCGMMergerTrackFit::Thread<0>(int nBlocks, int nThreads, int iBlock, int iThread, GPUsharedref() GPUSharedMemory& GPUrestrict() smem, processorType& GPUrestrict() merger)`
`23`	`23`	`{`
`24`	`24`	`#if defined(WITH_OPENMP) && !defined(GPUCA_GPUCODE)`
`25`	`25`	`#pragma omp parallel for num_threads(merger.GetRec().GetDeviceProcessingSettings().nThreads)`
Original file line number	Diff line number	Diff line change
`@@ -16,7 +16,7 @@`
`16`	`16`
`17`	`17`	`using namespace GPUCA_NAMESPACE::gpu;`
`18`	`18`
`19`		`-GPUd() int GPUTPCGMPhysicalTrackModel::PropagateToXBzLight(float x, float Bz, float& dLp)`
	`19`	`+GPUd() int GPUTPCGMPhysicalTrackModel::PropagateToXBzLight(float x, float Bz, float& GPUrestrict() dLp)`
`20`	`20`	`{`
`21`	`21`	`GPUTPCGMPhysicalTrackModel t = *this;`
`22`	`22`	`if (CAMath::Abs(x - t.X()) < 1.e-8f) {`
`@@ -31,7 +31,7 @@ GPUd() int GPUTPCGMPhysicalTrackModel::PropagateToXBzLight(float x, float Bz, fl`
`31`	`31`	`return 0;`
`32`	`32`	`}`
`33`	`33`
`34`		`-GPUd() int GPUTPCGMPhysicalTrackModel::PropagateToXBzLightNoUpdate(float x, float Bz, float& dLp)`
	`34`	`+GPUd() int GPUTPCGMPhysicalTrackModel::PropagateToXBzLightNoUpdate(float x, float Bz, float& GPUrestrict() dLp)`
`35`	`35`	`{`
`36`	`36`	`//`
`37`	`37`	`// transport the track to X=x in magnetic field B = ( 0, 0, Bz[kG*0.000299792458] )`
`@@ -85,7 +85,7 @@ GPUd() int GPUTPCGMPhysicalTrackModel::PropagateToXBzLightNoUpdate(float x, floa`
`85`	`85`	`return 0;`
`86`	`86`	`}`
`87`	`87`
`88`		`-GPUd() int GPUTPCGMPhysicalTrackModel::PropagateToXBxByBz(float x, float Bx, float By, float Bz, float& dLp)`
	`88`	`+GPUd() int GPUTPCGMPhysicalTrackModel::PropagateToXBxByBz(float x, float Bx, float By, float Bz, float& GPUrestrict() dLp)`
`89`	`89`	`{`
`90`	`90`	`//`
`91`	`91`	`// transport the track to X=x in magnetic field B = ( Bx, By, Bz )[kG*0.000299792458]`
Original file line number	Diff line number	Diff line change
`@@ -164,7 +164,7 @@ class GPUTPCGMPhysicalTrackModel`
`164`	`164`
`165`	`165`	`GPUdi() GPUTPCGMPhysicalTrackModel::GPUTPCGMPhysicalTrackModel(const GPUTPCGMTrackParam& t) { Set(t); }`
`166`	`166`
`167`		`-GPUdi() void GPUTPCGMPhysicalTrackModel::Set(const GPUTPCGMTrackParam& t)`
	`167`	`+GPUdi() void GPUTPCGMPhysicalTrackModel::Set(const GPUTPCGMTrackParam& GPUrestrict() t)`
`168`	`168`	`{`
`169`	`169`	`float pti = CAMath::Abs(t.GetQPt());`
`170`	`170`	`if (pti < 1.e-4f) {`