Merge pull request #2185 from bstatcomp/opencl_gamma_lpdf

rok-cesnovar · web-flow · commit d47c331a693a · 2020-11-23T09:26:40.000+01:00
Opencl gamma_lpdf and gumbel_lpdf
diff --git a/stan/math/opencl/kernel_generator/check_cl.hpp b/stan/math/opencl/kernel_generator/check_cl.hpp
@@ -58,6 +58,7 @@ class check_cl_ : public operation_cl_lhs<check_cl_<T>, bool> {
         err_variable_(err_variable),
         must_be_(must_be) {
     buffer_.zeros();
+    buffer_.view(matrix_cl_view::Entire);
   }
 
   // this operation can not be used on the right hand side of assignment
@@ -86,7 +87,7 @@ class check_cl_ : public operation_cl_lhs<check_cl_<T>, bool> {
                   + type_str<value_type_t<T>>() + "* " + var_name_ + "_value, ";
       res.body += "bool " + var_name_;
       res.body_suffix += "if(!" + var_name_ +
-            " && atomic_xchg(" + var_name_ + "_buffer, 1) == 1){\n"
+            " && atomic_xchg(" + var_name_ + "_buffer, 1) == 0){\n"
           + var_name_ + "_buffer[1] = " + row_index_name + ";\n"
           + var_name_ + "_buffer[2] = " + col_index_name + ";\n"
           + var_name_ + "_value[0] = " + arg_.var_name_ + ";\n"
diff --git a/stan/math/opencl/opencl.hpp b/stan/math/opencl/opencl.hpp
@@ -119,7 +119,9 @@
 #include <stan/math/opencl/prim/exp_mod_normal_lpdf.hpp>
 #include <stan/math/opencl/prim/exponential_lpdf.hpp>
 #include <stan/math/opencl/prim/frechet_lpdf.hpp>
+#include <stan/math/opencl/prim/gamma_lpdf.hpp>
 #include <stan/math/opencl/prim/gp_exp_quad_cov.hpp>
+#include <stan/math/opencl/prim/gumbel_lpdf.hpp>
 #include <stan/math/opencl/prim/inv.hpp>
 #include <stan/math/opencl/prim/inv_chi_square_lpdf.hpp>
 #include <stan/math/opencl/prim/inv_cloglog.hpp>
diff --git a/stan/math/opencl/prim/gamma_lpdf.hpp b/stan/math/opencl/prim/gamma_lpdf.hpp
@@ -0,0 +1,137 @@
+#ifndef STAN_MATH_OPENCL_PRIM_GAMMA_LPDF_HPP
+#define STAN_MATH_OPENCL_PRIM_GAMMA_LPDF_HPP
+#ifdef STAN_OPENCL
+
+#include <stan/math/opencl/kernel_generator.hpp>
+#include <stan/math/opencl/prim/size.hpp>
+#include <stan/math/prim/meta.hpp>
+#include <stan/math/prim/err.hpp>
+#include <stan/math/prim/fun/constants.hpp>
+#include <stan/math/prim/fun/digamma.hpp>
+#include <stan/math/prim/fun/lgamma.hpp>
+#include <stan/math/prim/fun/max_size.hpp>
+#include <stan/math/prim/functor/operands_and_partials.hpp>
+
+namespace stan {
+namespace math {
+
+/** \ingroup opencl
+ * The log of a gamma density for y with the specified
+ * shape and inverse scale parameters.
+ * Shape and inverse scale parameters must be greater than 0.
+ * y must be greater than or equal to 0.
+ *
+ \f{eqnarray*}{
+ y &\sim& \mbox{\sf{Gamma}}(\alpha, \beta) \\
+ \log (p (y \, |\, \alpha, \beta) ) &=& \log \left(
+ \frac{\beta^\alpha}{\Gamma(\alpha)} y^{\alpha - 1} \exp^{- \beta y} \right) \\
+ &=& \alpha \log(\beta) - \log(\Gamma(\alpha)) + (\alpha - 1) \log(y) - \beta
+ y\\ & & \mathrm{where} \; y > 0 \f}
+ *
+ * @tparam T_y_cl type of scalar
+ * @tparam T_shape_cl type of shape
+ * @tparam T_inv_scale_cl type of inverse scale
+ * @param y A scalar variable.
+ * @param alpha Shape parameter.
+ * @param beta Inverse scale parameter.
+ * @throw std::domain_error if alpha is not greater than 0.
+ * @throw std::domain_error if beta is not greater than 0.
+ * @throw std::domain_error if y is not greater than or equal to 0.
+ */
+template <bool propto, typename T_y_cl, typename T_shape_cl,
+          typename T_inv_scale_cl,
+          require_all_prim_or_rev_kernel_expression_t<
+              T_y_cl, T_shape_cl, T_inv_scale_cl>* = nullptr,
+          require_any_not_stan_scalar_t<T_y_cl, T_shape_cl,
+                                        T_inv_scale_cl>* = nullptr>
+return_type_t<T_y_cl, T_shape_cl, T_inv_scale_cl> gamma_lpdf(
+    const T_y_cl& y, const T_shape_cl& alpha, const T_inv_scale_cl& beta) {
+  using std::isfinite;
+  using std::isnan;
+  static const char* function = "gamma_lpdf(OpenCL)";
+  using T_partials_return
+      = partials_return_t<T_y_cl, T_shape_cl, T_inv_scale_cl>;
+
+  check_consistent_sizes(function, "Random variable", y, "Shape parameter",
+                         alpha, "Inverse scale parameter", beta);
+  const size_t N = max_size(y, alpha, beta);
+  if (N == 0) {
+    return 0.0;
+  }
+  if (!include_summand<propto, T_y_cl, T_shape_cl, T_inv_scale_cl>::value) {
+    return 0.0;
+  }
+
+  const auto& y_val = value_of(y);
+  const auto& alpha_val = value_of(alpha);
+  const auto& beta_val = value_of(beta);
+
+  auto check_y_not_nan
+      = check_cl(function, "Random variable", y_val, "not NaN");
+  auto y_not_nan_expr = !isnan(y_val);
+  auto check_alpha_pos_finite
+      = check_cl(function, "Shape parameter", alpha_val, "positive finite");
+  auto alpha_pos_finite_expr = alpha_val > 0 && isfinite(alpha_val);
+  auto check_beta_pos_finite = check_cl(function, "Inverse scale parameter",
+                                        beta_val, "positive finite");
+  auto beta_pos_finite_expr = beta_val > 0 && isfinite(beta_val);
+
+  auto any_y_negative_expr = colwise_max(constant(0, N, 1) + (y_val < 0));
+  auto log_y_expr = log(y_val);
+  auto log_beta_expr = log(beta_val);
+  auto logp1_expr = static_select<include_summand<propto, T_shape_cl>::value>(
+      -lgamma(alpha_val), constant(0.0, N, 1));
+  auto logp2_expr = static_select<
+      include_summand<propto, T_shape_cl, T_inv_scale_cl>::value>(
+      logp1_expr + elt_multiply(alpha_val, log_beta_expr), logp1_expr);
+  auto logp3_expr
+      = static_select<include_summand<propto, T_y_cl, T_shape_cl>::value>(
+          logp2_expr + elt_multiply(alpha_val - 1.0, log_y_expr), logp2_expr);
+  auto logp_expr = colwise_sum(
+      static_select<include_summand<propto, T_y_cl, T_inv_scale_cl>::value>(
+          logp3_expr - elt_multiply(beta_val, y_val), logp3_expr));
+
+  auto y_deriv_expr = elt_divide(alpha_val - 1, y_val) - beta_val;
+  auto alpha_deriv_expr = log_beta_expr + log_y_expr - digamma(alpha_val);
+  auto beta_deriv_expr = elt_divide(alpha_val, beta_val) - y_val;
+
+  matrix_cl<int> any_y_negative_cl;
+  matrix_cl<double> logp_cl;
+  matrix_cl<double> y_deriv_cl;
+  matrix_cl<double> alpha_deriv_cl;
+  matrix_cl<double> beta_deriv_cl;
+
+  results(check_y_not_nan, check_alpha_pos_finite, check_beta_pos_finite,
+          any_y_negative_cl, logp_cl, y_deriv_cl, alpha_deriv_cl, beta_deriv_cl)
+      = expressions(
+          y_not_nan_expr, alpha_pos_finite_expr, beta_pos_finite_expr,
+          any_y_negative_expr, logp_expr,
+          calc_if<!is_constant<T_y_cl>::value>(y_deriv_expr),
+          calc_if<!is_constant<T_shape_cl>::value>(alpha_deriv_expr),
+          calc_if<!is_constant<T_inv_scale_cl>::value>(beta_deriv_expr));
+
+  if (from_matrix_cl(any_y_negative_cl).any()) {
+    return LOG_ZERO;
+  }
+
+  T_partials_return logp = sum(from_matrix_cl(logp_cl));
+
+  operands_and_partials<T_y_cl, T_shape_cl, T_inv_scale_cl> ops_partials(
+      y, alpha, beta);
+  if (!is_constant<T_y_cl>::value) {
+    ops_partials.edge1_.partials_ = std::move(y_deriv_cl);
+  }
+  if (!is_constant<T_shape_cl>::value) {
+    ops_partials.edge2_.partials_ = std::move(alpha_deriv_cl);
+  }
+  if (!is_constant<T_inv_scale_cl>::value) {
+    ops_partials.edge3_.partials_ = std::move(beta_deriv_cl);
+  }
+
+  return ops_partials.build(logp);
+}
+
+}  // namespace math
+}  // namespace stan
+#endif
+#endif
diff --git a/stan/math/opencl/prim/gumbel_lpdf.hpp b/stan/math/opencl/prim/gumbel_lpdf.hpp
@@ -0,0 +1,114 @@
+#ifndef STAN_MATH_OPENCL_PRIM_GUMBEL_LPDF_HPP
+#define STAN_MATH_OPENCL_PRIM_GUMBEL_LPDF_HPP
+#ifdef STAN_OPENCL
+
+#include <stan/math/opencl/kernel_generator.hpp>
+#include <stan/math/opencl/prim/size.hpp>
+#include <stan/math/prim/meta.hpp>
+#include <stan/math/prim/err.hpp>
+#include <stan/math/prim/fun/elt_divide.hpp>
+#include <stan/math/prim/fun/max_size.hpp>
+#include <stan/math/prim/functor/operands_and_partials.hpp>
+
+namespace stan {
+namespace math {
+
+/** \ingroup opencl
+ * Returns the Gumbel log probability density for the given
+ * location and scale. Given containers of matching sizes, returns the
+ * log sum of densities.
+ *
+ * @tparam T_y_cl type of real parameter
+ * @tparam T_loc_cl type of location parameter
+ * @tparam T_scale_cl type of scale parameter
+ * @param y real parameter
+ * @param mu location parameter
+ * @param beta scale parameter
+ * @return log probability density or log sum of probability densities
+ * @throw std::domain_error if y is nan, mu is infinite, or beta is nonpositive
+ * @throw std::invalid_argument if container sizes mismatch
+ */
+template <
+    bool propto, typename T_y_cl, typename T_loc_cl, typename T_scale_cl,
+    require_all_prim_or_rev_kernel_expression_t<T_y_cl, T_loc_cl,
+                                                T_scale_cl>* = nullptr,
+    require_any_not_stan_scalar_t<T_y_cl, T_loc_cl, T_scale_cl>* = nullptr>
+return_type_t<T_y_cl, T_loc_cl, T_scale_cl> gumbel_lpdf(
+    const T_y_cl& y, const T_loc_cl& mu, const T_scale_cl& beta) {
+  using std::isfinite;
+  using std::isnan;
+  static const char* function = "gumbel_lpdf(OpenCL)";
+  using T_partials_return = partials_return_t<T_y_cl, T_loc_cl, T_scale_cl>;
+
+  check_consistent_sizes(function, "Random variable", y, "Location parameter",
+                         mu, "Scale parameter", beta);
+  const size_t N = max_size(y, mu, beta);
+  if (N == 0) {
+    return 0.0;
+  }
+  if (!include_summand<propto, T_y_cl, T_loc_cl, T_scale_cl>::value) {
+    return 0.0;
+  }
+
+  const auto& y_val = value_of(y);
+  const auto& mu_val = value_of(mu);
+  const auto& beta_val = value_of(beta);
+
+  auto check_y_not_nan
+      = check_cl(function, "Random variable", y_val, "not NaN");
+  auto y_not_nan_expr = !isnan(y_val);
+  auto check_mu_finite
+      = check_cl(function, "Location parameter", mu_val, "finite");
+  auto mu_finite_expr = isfinite(mu_val);
+  auto check_beta_positive
+      = check_cl(function, "Scale parameter", beta_val, "positive ");
+  auto beta_positive_expr = beta_val > 0;
+
+  auto inv_beta_expr = elt_divide(1.0, beta_val);
+  auto y_minus_mu_over_beta_expr = elt_multiply(y_val - mu_val, inv_beta_expr);
+  auto exp_y_m_mu_over_beta_expr = exp(-y_minus_mu_over_beta_expr);
+
+  auto logp1_expr = -y_minus_mu_over_beta_expr - exp_y_m_mu_over_beta_expr;
+  auto logp_expr
+      = colwise_sum(static_select<include_summand<propto, T_scale_cl>::value>(
+          logp1_expr - log(beta_val), logp1_expr));
+
+  auto scaled_diff_expr
+      = elt_multiply(inv_beta_expr, exp_y_m_mu_over_beta_expr) - inv_beta_expr;
+  auto beta_deriv_expr
+      = elt_multiply(-y_minus_mu_over_beta_expr, scaled_diff_expr)
+        - inv_beta_expr;
+
+  matrix_cl<double> logp_cl;
+  matrix_cl<double> y_deriv_cl;
+  matrix_cl<double> mu_deriv_cl;
+  matrix_cl<double> beta_deriv_cl;
+
+  results(check_y_not_nan, check_mu_finite, check_beta_positive, logp_cl,
+          y_deriv_cl, mu_deriv_cl, beta_deriv_cl)
+      = expressions(y_not_nan_expr, mu_finite_expr, beta_positive_expr,
+                    logp_expr,
+                    calc_if<!is_constant<T_y_cl>::value>(scaled_diff_expr),
+                    calc_if<!is_constant<T_loc_cl>::value>(-scaled_diff_expr),
+                    calc_if<!is_constant<T_scale_cl>::value>(beta_deriv_expr));
+
+  T_partials_return logp = sum(from_matrix_cl(logp_cl));
+
+  operands_and_partials<T_y_cl, T_loc_cl, T_scale_cl> ops_partials(y, mu, beta);
+  if (!is_constant<T_y_cl>::value) {
+    ops_partials.edge1_.partials_ = std::move(y_deriv_cl);
+  }
+  if (!is_constant<T_loc_cl>::value) {
+    ops_partials.edge2_.partials_ = std::move(mu_deriv_cl);
+  }
+  if (!is_constant<T_scale_cl>::value) {
+    ops_partials.edge3_.partials_ = std::move(beta_deriv_cl);
+  }
+
+  return ops_partials.build(logp);
+}
+
+}  // namespace math
+}  // namespace stan
+#endif
+#endif
diff --git a/stan/math/opencl/prim/size.hpp b/stan/math/opencl/prim/size.hpp
@@ -9,7 +9,7 @@ namespace math {
 
 /**
  * Returns the size (number of the elements) of a `matrix_cl`.
- * @param m `matric_cl` to determine size of
+ * @param m `matrix_cl` to determine size of
  * @return number of elements in a
  */
 template <typename T,
diff --git a/stan/math/prim/prob/gamma_lpdf.hpp b/stan/math/prim/prob/gamma_lpdf.hpp
@@ -42,7 +42,9 @@ namespace math {
  * @throw std::domain_error if beta is not greater than 0.
  * @throw std::domain_error if y is not greater than or equal to 0.
  */
-template <bool propto, typename T_y, typename T_shape, typename T_inv_scale>
+template <bool propto, typename T_y, typename T_shape, typename T_inv_scale,
+          require_all_not_nonscalar_prim_or_rev_kernel_expression_t<
+              T_y, T_shape, T_inv_scale>* = nullptr>
 return_type_t<T_y, T_shape, T_inv_scale> gamma_lpdf(const T_y& y,
                                                     const T_shape& alpha,
                                                     const T_inv_scale& beta) {
diff --git a/stan/math/prim/prob/gumbel_lpdf.hpp b/stan/math/prim/prob/gumbel_lpdf.hpp
@@ -31,7 +31,9 @@ namespace math {
  * @throw std::domain_error if y is nan, mu is infinite, or beta is nonpositive
  * @throw std::invalid_argument if container sizes mismatch
  */
-template <bool propto, typename T_y, typename T_loc, typename T_scale>
+template <bool propto, typename T_y, typename T_loc, typename T_scale,
+          require_all_not_nonscalar_prim_or_rev_kernel_expression_t<
+              T_y, T_loc, T_scale>* = nullptr>
 return_type_t<T_y, T_loc, T_scale> gumbel_lpdf(const T_y& y, const T_loc& mu,
                                                const T_scale& beta) {
   using T_partials_return = partials_return_t<T_y, T_loc, T_scale>;
@@ -59,7 +61,6 @@ return_type_t<T_y, T_loc, T_scale> gumbel_lpdf(const T_y& y, const T_loc& mu,
 
   check_not_nan(function, "Random variable", y_val);
   check_finite(function, "Location parameter", mu_val);
-  check_not_nan(function, "Scale parameter", beta_val);
   check_positive(function, "Scale parameter", beta_val);
 
   if (size_zero(y, mu, beta)) {
diff --git a/test/unit/math/opencl/kernel_generator/reference_kernels/check_cl_positive.cl b/test/unit/math/opencl/kernel_generator/reference_kernels/check_cl_positive.cl
@@ -5,7 +5,7 @@ double var2 = 0; if (!((!contains_nonzero(var2_view, LOWER) && j < i) || (!conta
 bool var1 = var2 > var3;
 double var5 = 0; if (!((!contains_nonzero(var5_view, LOWER) && j < i) || (!contains_nonzero(var5_view, UPPER) && j > i))) {var5 = var5_global[i + var5_rows * j];}
 bool var4 = var1;
-if(!var4 && atomic_xchg(var4_buffer, 1) == 1){
+if(!var4 && atomic_xchg(var4_buffer, 1) == 0){
 var4_buffer[1] = i;
 var4_buffer[2] = j;
 var4_value[0] = var5;
diff --git a/test/unit/math/opencl/rev/gamma_lpdf_test.cpp b/test/unit/math/opencl/rev/gamma_lpdf_test.cpp
diff --git a/test/unit/math/opencl/rev/gumbel_lpdf_test.cpp b/test/unit/math/opencl/rev/gumbel_lpdf_test.cpp