pocketpy · May 14, 2025
diff --git a/‎build.bat
Lines changed: 6 additions & 0 deletions b/‎build.bat
Lines changed: 6 additions & 0 deletions
diff --git a/‎include/cten.h
Lines changed: 7 additions & 3 deletions b/‎include/cten.h
Lines changed: 7 additions & 3 deletions
diff --git a/‎src/basic.c
Lines changed: 48 additions & 3 deletions b/‎src/basic.c
Lines changed: 48 additions & 3 deletions
diff --git a/‎src/nn.c
Lines changed: 163 additions & 19 deletions b/‎src/nn.c
Lines changed: 163 additions & 19 deletions
@@ -0,0 +1,6 @@
+@echo off
+if not exist build mkdir build
+cd build
+cmake .. -G "MinGW Makefiles"
+cmake --build .
+cd ..
@@ -24,6 +24,7 @@ typedef struct GradNode {
     struct Tensor (*grad_fn)(struct Tensor self, int i);
     struct Tensor inputs[4];
     int n_inputs;
+    const char* name;
 } GradNode;
 
 void cten_initilize();
@@ -39,11 +40,10 @@ int TensorShape_tostring(TensorShape shape, char* buf, int size);
 Tensor Tensor_new(TensorShape shape, bool requires_grad);
 Tensor Tensor_zeros(TensorShape shape, bool requires_grad);
 Tensor Tensor_ones(TensorShape shape, bool requires_grad);
+Tensor Tensor_transpose(Tensor self);
 
 float Tensor_get(Tensor self, int i, int j, int k, int l);
 void Tensor_set(Tensor self, int i, int j, int k, int l, float value);
-
-Tensor Tensor_detach(Tensor self);
 void Tensor_backward(Tensor self, Tensor grad);
 int Tensor_backward_apply(Tensor self, void (*f)(Tensor, void*), void* ctx);
 
@@ -87,8 +87,9 @@ Tensor nn_relu(Tensor input);
 Tensor nn_sigmoid(Tensor input);
 Tensor nn_tanh(Tensor input);
 Tensor nn_softmax(Tensor input);
-
+Tensor Glorot_init(TensorShape shape, bool requires_grad);
 Tensor nn_crossentropy(Tensor y_true, Tensor y_pred);
+Tensor nn_softmax_crossentropy(Tensor y_true, Tensor logits);
 
 /* Memory Management */
 typedef int64_t PoolId;
@@ -111,6 +112,9 @@ void cten_begin_eval();
 bool cten_is_eval();
 void cten_end_eval();
 
+/* Utils */
+void Tensor_normalize_dataset(const float (*X)[4], float (*X_norm)[4], int n_samples, int n_train_samples, int n_features);Tensor Tensor_detach(Tensor self);
+void Tensor_shuffle_dataset(const float (*X)[4], const int *y,float (*X_shuffled)[4], int *y_shuffled, int n_samples, int n_features);
 void cten_assert(bool cond, const char* fmt, ...);
 void cten_assert_shape(const char* title, TensorShape a, TensorShape b);
 void cten_assert_dim(const char* title, int a, int b);
 
@@ -5,6 +5,8 @@
 #include <stdio.h>
 #include <stdlib.h>
 #include <string.h>
+#include <math.h>
+#include <time.h>
 
 int TensorShape_numel(TensorShape shape) {
     int numel = 1;
@@ -39,6 +41,13 @@ Tensor Tensor_new(TensorShape shape, bool requires_grad) {
     int numel = TensorShape_numel(shape);
     self.data = _cten_malloc(sizeof(FloatBuffer) + sizeof(float) * numel);
     self.data->numel = numel;
+    
+    //Initialize tensor with random values
+    float* data_ptr = self.data->flex;
+    for (int i = 0; i < numel; i++) {
+        data_ptr[i] = ((float)rand() / RAND_MAX) * 2.0f - 1.0f;
+    }
+    
     if(requires_grad) {
         self.node = _cten_malloc(sizeof(GradNode));
         memset(self.node, 0, sizeof(GradNode));
@@ -61,6 +70,27 @@ Tensor Tensor_ones(TensorShape shape, bool requires_grad) {
     }
     return self;
 }
+Tensor Tensor_transpose(Tensor self) {
+    int dim = TensorShape_dim(self.shape);
+    if(dim < 2){
+        return self; 
+    }
+    TensorShape new_shape;
+    new_shape[0] = self.shape[1];
+    new_shape[1] = self.shape[0];
+    for(int i = 2; i < 4; i++) {
+        new_shape[i] = self.shape[i];
+    }
+    Tensor result = Tensor_new(new_shape, false);
+    int rows = self.shape[0];
+    int cols = self.shape[1];
+    for(int i = 0; i < rows; i++) {
+        for(int j = 0; j < cols; j++) {
+            result.data->flex[j * rows + i] = self.data->flex[i * cols + j];
+        }
+    }
+    return result;
+}
 
 float Tensor_get(Tensor self, int i, int j, int k, int l) {
     assert((self.shape[0] == 0 && i == 0) || (i >= 0 && i < self.shape[0]));
@@ -90,17 +120,32 @@ void Tensor_backward(Tensor self, Tensor grad) {
     if(self.node == NULL) return;
     if(grad.data == NULL) {
         assert(self.data->numel == 1);
-        grad = Tensor_ones((TensorShape){0}, false);
+        grad = Tensor_ones((TensorShape){1}, false);
     }
+    
     assert(grad.node == NULL);
     if(self.node->grad.data == NULL) {
         self.node->grad = grad;
     } else {
         self.node->grad = Tensor_add(self.node->grad, grad);
     }
+
     for(int i = 0; i < self.node->n_inputs; i++) {
-        grad = Tensor_mul(grad, self.node->grad_fn(self, i));
-        Tensor_backward(self.node->inputs[i], grad);
+        if (self.node->inputs[i].data == NULL) continue;
+        Tensor combined_grad;  
+        Tensor input_grad = self.node->grad_fn(self, i); 
+        if(strcmp(self.node->name, "Matmul") == 0){
+            if (i == 0){
+                combined_grad = Tensor_matmul(grad, input_grad);
+            }
+            else{
+                combined_grad = Tensor_matmul(input_grad, grad);
+            }
+        }
+        else{
+            combined_grad = Tensor_mul(grad, input_grad);
+        }       
+        Tensor_backward(self.node->inputs[i], combined_grad);
     }
 }
 
 
@@ -4,6 +4,9 @@
 #include <assert.h>
 #include <math.h>
 #include <stddef.h>
+#include <stdlib.h>
+#include <time.h>
+#include <stdio.h>
 
 Tensor nn_linear(Tensor input, Tensor weight, Tensor bias) {
     Tensor tmp = Tensor_matmul(input, weight);
@@ -16,14 +19,14 @@ static Tensor GradFn_relu(Tensor self, int i) {
     Tensor input = self.node->inputs[i];
     Tensor res = Tensor_new(input.shape, false);
     for(int i = 0; i < input.data->numel; i++) {
-        res.data->flex[i] = input.data->flex[i] > 0 ? 1 : 0;
+        res.data->flex[i] = input.data->flex[i] > 0 ? 1.0f : 0.0f;
     }
     return res;
 }
 
 Tensor nn_relu(Tensor self) {
     bool requires_grad = !cten_is_eval() && self.node != NULL;
-    Tensor res = Tensor_new(self.shape, requires_grad);
+    Tensor res = Tensor_zeros(self.shape, requires_grad);
     for(int i = 0; i < self.data->numel; i++) {
         res.data->flex[i] = fmaxf(0, self.data->flex[i]);
     }
@@ -32,23 +35,52 @@ Tensor nn_relu(Tensor self) {
         res.node->grad_fn = GradFn_relu;
         res.node->inputs[0] = self;
         res.node->n_inputs = 1;
+        res.node->name = "Relu";
+
+    }
+    return res;
+}
+
+Tensor Glorot_init(TensorShape shape, bool requires_grad) {
+    Tensor res = Tensor_new(shape, requires_grad);
+    int fan_in = shape[0];
+    int fan_out = shape[1];
+    float scale = sqrtf(6.0f / (fan_in + fan_out));
+    
+    for(int i = 0; i < res.data->numel; i++) {
+        float r = (float)rand() / RAND_MAX * 2.0f - 1.0f; 
+        res.data->flex[i] = r * scale;
     }
     return res;
 }
 
-/* nn.softmax */
 static Tensor GradFn_softmax(Tensor self, int i) {
     Tensor input = self.node->inputs[i];
-    Tensor res = Tensor_new(input.shape, false);
-    for(int j = 0; j < input.data->numel; j++) {
-        float softmax_j = self.data->flex[j];
-        for(int k = 0; k < input.data->numel; k++) {
-            float softmax_k = self.data->flex[k];
-            float delta_jk = (j == k) ? 1.0f : 0.0f;
-            res.data->flex[j * input.data->numel + k] = softmax_j * (delta_jk - softmax_k);
+    Tensor grad = Tensor_new(input.shape, false);
+    
+    int dim = TensorShape_dim(self.shape);
+    int batch_size = self.shape[0];
+    int num_classes = self.shape[1];  
+    for(int b = 0; b < batch_size; b++){
+        for(int i = 0; i < num_classes; i++) {
+            for(int j = 0; j < num_classes; j++) {
+                float softmax_i = self.data->flex[b * num_classes + i];
+                float softmax_j = self.data->flex[b * num_classes + j];
+                float value;
+                if(i == j){
+                    value = softmax_i * (1.0f - softmax_i);
+                } 
+                else{
+                    value = -softmax_i * softmax_j;
+                }
+                
+                if(i == j){
+                    grad.data->flex[b * num_classes + i] = value;
+                }
+            }
         }
     }
-    return res;
+    return grad;
 }
 
 Tensor nn_softmax(Tensor self) {
@@ -83,12 +115,38 @@ Tensor nn_softmax(Tensor self) {
     if(requires_grad) {
         res.node->grad_fn = GradFn_softmax;
         res.node->inputs[0] = self;
-        res.node->n_inputs = 1;
+        res.node->n_inputs = 1; 
+        res.node->name = "Softmax";     
     }
     return res;
 }
 
 /* nn.cross_entropy */
+static Tensor GradFn_crossentropy(Tensor self, int i) {
+    if (i == 1) { // Gradient w.r.t. y_pred
+        Tensor y_true = self.node->inputs[0];
+        Tensor y_pred = self.node->inputs[1];
+        int n_samples = y_true.shape[0];
+        int n_classes = y_true.shape[1];
+        
+        Tensor grad = Tensor_new(y_pred.shape, false);
+        
+        for (int i = 0; i < n_samples; i++) {
+            for (int j = 0; j < n_classes; j++) {
+                float y_true_val = y_true.data->flex[i * n_classes + j];
+                float y_pred_val = y_pred.data->flex[i * n_classes + j];
+                if (y_true_val == 0) {
+                    grad.data->flex[i * n_classes + j] = 0;
+                } else {
+                    grad.data->flex[i * n_classes + j] = -y_true_val / y_pred_val;
+                }
+            }
+        }
+        return grad;
+    }
+    return Tensor_zeros((TensorShape){1}, false);
+}
+
 Tensor nn_crossentropy(Tensor y_true, Tensor y_pred) {
     // y_true: [None, n_classes]
     // y_pred: [None, n_classes]
@@ -100,15 +158,101 @@ Tensor nn_crossentropy(Tensor y_true, Tensor y_pred) {
     assert(n_samples == y_pred.shape[0]);
     assert(n_classes == y_pred.shape[1]);
 
-    bool requires_grad = !cten_is_eval() && (y_true.node != NULL || y_pred.node != NULL);
-    Tensor res = Tensor_new((TensorShape){n_samples}, requires_grad);
+    bool requires_grad = !cten_is_eval() && (y_true.node != NULL || y_pred.node != NULL); //No eval but rather training so requires grad is True
+    Tensor res = Tensor_zeros((TensorShape){1}, requires_grad);
+    
+    // Calculate cross-entropy loss
+    float total_loss = 0.0f;
     for(int i = 0; i < n_samples; i++) {
-        float loss = 0;
+        float sample_loss = 0.0f;
         for(int j = 0; j < n_classes; j++) {
-            loss +=
-                y_true.data->flex[i * n_classes + j] * logf(y_pred.data->flex[i * n_classes + j]);
+            float true_val = y_true.data->flex[i * n_classes + j];
+            float pred_val = y_pred.data->flex[i * n_classes + j];
+            float epsilon = 1e-8f; // avoid log(0) so we add a small epsilon
+            if (true_val > 0) { // one-hot encoding
+                sample_loss -= true_val * logf(pred_val + epsilon);
+            }
         }
-        res.data->flex[i] = -loss;
+        total_loss += sample_loss;
+    }
+    
+    res.data->flex[0] = total_loss / n_samples;
+    
+    if(requires_grad) {
+        res.node->grad_fn = GradFn_crossentropy;
+        res.node->inputs[0] = y_true;
+        res.node->inputs[1] = y_pred;
+        res.node->n_inputs = 2;
+        res.node->name = "Cross-entropy";       
     }
-    return Tensor_mean(res);
+
+    return res;
+}
+
+static Tensor GradFn_softmax_crossentropy(Tensor self, int i) {
+    if (i == 1) {
+        Tensor y_true = self.node->inputs[0];
+        Tensor logits = self.node->inputs[1];
+        
+        Tensor y_pred = Tensor_new(logits.shape, false);
+        int self_dim = TensorShape_dim(logits.shape);
+        int last_dim_size = logits.shape[self_dim - 1];
+        int outer_size = logits.data->numel / last_dim_size;
+
+        for(int outer = 0; outer < outer_size; outer++) {
+            float max_val = -INFINITY;
+            float sum = 0;
+
+            for(int d = 0; d < last_dim_size; d++) {
+                int index = outer * last_dim_size + d;
+                max_val = fmaxf(max_val, logits.data->flex[index]);
+            }
+
+            for(int d = 0; d < last_dim_size; d++) {
+                int index = outer * last_dim_size + d;
+                y_pred.data->flex[index] = expf(logits.data->flex[index] - max_val);
+                sum += y_pred.data->flex[index];
+            }
+
+            for(int d = 0; d < last_dim_size; d++) {
+                int index = outer * last_dim_size + d;
+                y_pred.data->flex[index] /= sum;
+            }
+        }
+        
+        Tensor grad = Tensor_new(y_pred.shape, false);
+        int n_samples = y_pred.shape[0];
+        int n_classes = y_pred.shape[1];
+        
+        for (int i = 0; i < n_samples; i++) {
+            for (int j = 0; j < n_classes; j++) {
+                grad.data->flex[i * n_classes + j] = 
+                    y_pred.data->flex[i * n_classes + j] - y_true.data->flex[i * n_classes + j];
+            }
+        }
+        
+        return grad;
+    }
+    return Tensor_zeros((TensorShape){1}, false);
+}
+
+Tensor nn_softmax_crossentropy(Tensor y_true, Tensor logits) {
+    bool requires_grad = !cten_is_eval() && logits.node != NULL;
+    //disable gradient computation
+    cten_begin_eval(); 
+    Tensor y_pred = nn_softmax(logits);
+    Tensor loss = nn_crossentropy(y_true, y_pred);
+    cten_end_eval();
+    Tensor res = Tensor_zeros((TensorShape){1}, requires_grad);
+    res.data->flex[0] = loss.data->flex[0];
+    
+    if(requires_grad) {
+        res.node->grad_fn = GradFn_softmax_crossentropy;
+        res.node->inputs[0] = y_true;
+        res.node->inputs[1] = logits;
+        res.node->n_inputs = 2;
+        res.node->name = "SoftmaxCrossEntropy"; 
+    }
+    
+    return res;
 }