added try/except to training evaluation and unsqueeze correctly to model

vrnmthr · vrnmthr · commit c012be5d17a4 · 2019-08-09T12:18:57.000-04:00
diff --git a/README.md b/README.md
@@ -1,2 +1,8 @@
 # python-ner
 A neural NER implementation built first for unstructured text
+
+# Resources:
+https://medium.com/@rohit.sharma_7010/a-complete-tutorial-for-named-entity-recognition-and-extraction-in-natural-language-processing-71322b6fb090
+https://pytorch.org/tutorials/beginner/nlp/advanced_tutorial.html
+https://pytorch-crf.readthedocs.io/en/stable/
+https://www.aclweb.org/anthology/Y18-1061
diff --git a/model.py b/model.py
@@ -42,13 +42,14 @@ def forward(self, sentence):
         :return: a list of words
         """
         self.hidden = self.init_hidden()
-        # we unsqueeze because elmo only takes batches
+        # embeds = [1, sentence_len, 1024]
         embeds = self.elmo([sentence])
         # lstm_out = (1, seq_len, hidden_size * 2)
         lstm_out, hidden_out = self.lstm(embeds, self.hidden)
         predictions = self.linear(lstm_out)
         # squeeze the result to get rid of the batch for (seq_len, 2)
-        return predictions.squeeze()
+        predictions = predictions.squeeze(0)
+        return predictions
 
     def evaluate(self, sentence):
         """
diff --git a/train.py b/train.py
@@ -11,7 +11,7 @@
 from entity_recognition_datasets.src import utils
 from model import BiLSTM
 
-EPOCHS = 5
+EPOCHS = 4
 LOSS_FUNC = nn.CrossEntropyLoss()
 
 
@@ -50,7 +50,7 @@ def train_single(sentence, optimizer, backprop):
             optimizer.step()
         loss = loss.item()
     except Exception as e:
-        print("e")
+        print(e)
         print("words: {}".format(words))
         print("tags: {}".format(tags))
         print("continuing...")
@@ -72,32 +72,32 @@ def train():
     dev_losses = []
     for epoch in range(EPOCHS):
         print("EPOCH {}/{}".format(epoch + 1, EPOCHS))
-        start = time.time()
 
         # run train epoch
+        start = time.time()
         train_loss = 0
         for sentence in tqdm(train_data, desc="train-set"):
             loss = train_single(sentence, optimizer, backprop=True)
             train_loss += loss
         train_loss /= len(train_data)
         train_losses.append(train_loss)
+        duration = time.time() - start
+        print("train set completed in {:.3f}s, {:.3f}s per iteration".format(duration, duration / len(train_data)))
 
         # run a dev epoch
+        start = time.time()
         dev_loss = 0
         with torch.no_grad():
             for sentence in tqdm(dev_data, desc="dev-set"):
                 loss = train_single(sentence, optimizer, backprop=False)
-                train_loss += loss
+                dev_loss += loss
         dev_loss /= len(dev_data)
         dev_losses.append(dev_loss)
+        duration = time.time() - start
+        print("dev set completed in {:.3f}s, {:.3f}s per iteration".format(duration, duration / len(dev_data)))
 
         print("train loss = {}".format(train_loss))
         print("dev loss = {}".format(dev_loss))
-        duration = time.time() - start
-        print("epoch completed in {:.3f}s, {:.3f}s per iteration".format(
-            duration,
-            duration / (len(train_data) + len(dev_data))
-        ))
 
     losses = {
         "train": train_losses,
@@ -120,11 +120,17 @@ def evaluate():
     with torch.no_grad():
         confusion = np.zeros((2, 2))
         for sentence in tqdm(test_data, desc="train-set"):
-            words, tags = get_words_and_tags(sentence)
-            pred = model.evaluate(words)
-            assert len(pred) == len(tags)
-            for i in range(len(pred)):
-                confusion[pred[i]][tags[i]] += 1
+            try:
+                words, tags = get_words_and_tags(sentence)
+                pred = model.evaluate(words)
+                assert len(pred) == len(tags)
+                for i in range(len(pred)):
+                    confusion[pred[i]][tags[i]] += 1
+            except Exception as e:
+                print(e)
+                print("words: {}".format(words))
+                print("tags: {}".format(tags))
+                print("continuing...")
 
         confusion /= np.sum(confusion)
         return confusion