Balancing the workload turns out to be very efficient

2025-06-26 01:42:36 +00:00 · 2016-05-12 09:24:20 +02:00 · 2016-05-12 09:24:20 +02:00 · dca9683b3b
commit dca9683b3b
parent aefd3b03a3
1 changed files with 14 additions and 22 deletions
--- a/src/hashcat.c
+++ b/src/hashcat.c
@ -2914,22 +2914,15 @@ static void autotune (hc_device_param_t *device_param)
    }
  }
-  // sometimes we're in a bad situation that the algorithm is so slow that we can not
+  // balancing the workload turns out to be very efficient
  // create enough kernel_accel to do both, keep the gpu busy and stay below target_ms.
  // however, we need to have a minimum kernel_accel and kernel_loops of 32.
  // luckily, at this level of workload, it became a linear function
-  if (kernel_accel < 32 || kernel_loops < 32)
+  const u32 kernel_power_balance = kernel_accel * kernel_loops;
  {
    const u32 kernel_power = kernel_accel * kernel_loops;
    // find sqrt
  u32 sqrtv;
  for (sqrtv = 1; sqrtv < 0x100000; sqrtv++)
  {
-      if ((sqrtv * sqrtv) >= kernel_power) break;
+    if ((sqrtv * sqrtv) >= kernel_power_balance) break;
  }
  const u32 kernel_accel_try = sqrtv;
@ -2940,7 +2933,6 @@ static void autotune (hc_device_param_t *device_param)
    kernel_accel = kernel_accel_try;
    kernel_loops = kernel_loops_try;
  }
  }
  // reset fake words