|
29 | 29 | },
|
30 | 30 | {
|
31 | 31 | "cell_type": "code",
|
32 |
| - "execution_count": 39, |
| 32 | + "execution_count": 109, |
33 | 33 | "metadata": {},
|
34 |
| - "outputs": [ |
35 |
| - { |
36 |
| - "name": "stdout", |
37 |
| - "output_type": "stream", |
38 |
| - "text": [ |
39 |
| - "Context: Pisma rabiniczne – w tym Miszna – stanowią kompilację poglądów różnych rabinów na określony temat. Zgodnie z wierzeniami judaizmu Mojżesz otrzymał od Boga całą Torę, ale w dwóch częściach: jedną część w formie pisanej, a drugą część w formie ustnej. Miszna – jako Tora ustna – była traktowana nie tylko jako uzupełnienie Tory spisanej, ale również jako jej interpretacja i wyjaśnienie w konkretnych sytuacjach życiowych. Tym samym Miszna stanowiąca kodeks Prawa religijnego zaczęła równocześnie służyć za jego ustnie przekazywany podręcznik.\n", |
40 |
| - "Question: Czym są pisma rabiniczne?\n", |
41 |
| - "Answer: {'text': ['kompilację poglądów różnych rabinów na określony temat'], 'answer_start': [43]}\n" |
42 |
| - ] |
43 |
| - } |
44 |
| - ], |
45 |
| - "source": [ |
46 |
| - "poquad_validation = poquad[\"validation\"]\n", |
47 |
| - "\n", |
48 |
| - "print(\"Context: \", poquad_validation[0][\"context\"])\n", |
49 |
| - "print(\"Question: \", poquad_validation[0][\"question\"])\n", |
50 |
| - "print(\"Answer: \", poquad_validation[0][\"answers\"])" |
51 |
| - ] |
52 |
| - }, |
53 |
| - { |
54 |
| - "cell_type": "code", |
55 |
| - "execution_count": 42, |
56 |
| - "metadata": {}, |
57 |
| - "outputs": [ |
58 |
| - { |
59 |
| - "data": { |
60 |
| - "text/plain": [ |
61 |
| - "Dataset({\n", |
62 |
| - " features: ['id', 'title', 'context', 'question', 'answers'],\n", |
63 |
| - " num_rows: 0\n", |
64 |
| - "})" |
65 |
| - ] |
66 |
| - }, |
67 |
| - "execution_count": 42, |
68 |
| - "metadata": {}, |
69 |
| - "output_type": "execute_result" |
70 |
| - } |
71 |
| - ], |
| 34 | + "outputs": [], |
72 | 35 | "source": [
|
73 |
| - "poquad_validation.filter(lambda x: len(x[\"answers\"][\"text\"]) != 1)" |
| 36 | + "poquad_validation = poquad[\"validation\"]" |
74 | 37 | ]
|
75 | 38 | },
|
76 | 39 | {
|
77 | 40 | "cell_type": "markdown",
|
78 | 41 | "metadata": {},
|
79 | 42 | "source": [
|
80 |
| - "Dla każdego pytania z zestawu walidacyjnego istnieje tylko jedna odpowiedź. Jednak dla niektórych zestaów pytań poprawnym może być kilka odpowiedzi." |
| 43 | + "## Load model" |
81 | 44 | ]
|
82 | 45 | },
|
83 | 46 | {
|
|
95 | 58 | ]
|
96 | 59 | },
|
97 | 60 | {
|
98 |
| - "cell_type": "code", |
99 |
| - "execution_count": 44, |
100 |
| - "metadata": {}, |
101 |
| - "outputs": [ |
102 |
| - { |
103 |
| - "name": "stdout", |
104 |
| - "output_type": "stream", |
105 |
| - "text": [ |
106 |
| - "True\n" |
107 |
| - ] |
108 |
| - } |
109 |
| - ], |
110 |
| - "source": [ |
111 |
| - "print(tokenizer.is_fast)" |
112 |
| - ] |
113 |
| - }, |
114 |
| - { |
115 |
| - "cell_type": "code", |
116 |
| - "execution_count": 45, |
| 61 | + "cell_type": "markdown", |
117 | 62 | "metadata": {},
|
118 |
| - "outputs": [ |
119 |
| - { |
120 |
| - "data": { |
121 |
| - "text/plain": [ |
122 |
| - "'<s>Czym są pisma rabiniczne?</s></s>Pisma rabiniczne – w tym Miszna – stanowią kompilację poglądów różnych rabinów na określony temat. Zgodnie z wierzeniami judaizmu Mojżesz otrzymał od Boga całą Torę, ale w dwóch częściach: jedną część w formie pisanej, a drugą część w formie ustnej. Miszna – jako Tora ustna – była traktowana nie tylko jako uzupełnienie Tory spisanej, ale również jako jej interpretacja i wyjaśnienie w konkretnych sytuacjach życiowych. Tym samym Miszna stanowiąca kodeks Prawa religijnego zaczęła równocześnie służyć za jego ustnie przekazywany podręcznik.</s>'" |
123 |
| - ] |
124 |
| - }, |
125 |
| - "execution_count": 45, |
126 |
| - "metadata": {}, |
127 |
| - "output_type": "execute_result" |
128 |
| - } |
129 |
| - ], |
130 | 63 | "source": [
|
131 |
| - "context = poquad_validation[0][\"context\"]\n", |
132 |
| - "question = poquad_validation[0][\"question\"]\n", |
| 64 | + "## Evaluate\n", |
133 | 65 | "\n",
|
134 |
| - "inputs = tokenizer(question, context)\n", |
135 |
| - "tokenizer.decode(inputs[\"input_ids\"])" |
| 66 | + "We select the `squad` validation. There is also a `squad_v2` validation that can be used to validation a dataset, where a question might not have an answer. This evaluation will calculate `exact_match` and `f1` metrics." |
136 | 67 | ]
|
137 | 68 | },
|
138 | 69 | {
|
|
172 | 103 | },
|
173 | 104 | {
|
174 | 105 | "cell_type": "code",
|
175 |
| - "execution_count": 106, |
| 106 | + "execution_count": 110, |
176 | 107 | "metadata": {},
|
177 | 108 | "outputs": [],
|
178 | 109 | "source": [
|
|
183 | 114 | },
|
184 | 115 | {
|
185 | 116 | "cell_type": "code",
|
186 |
| - "execution_count": 107, |
| 117 | + "execution_count": 111, |
187 | 118 | "metadata": {},
|
188 | 119 | "outputs": [],
|
189 | 120 | "source": [
|
|
194 | 125 | },
|
195 | 126 | {
|
196 | 127 | "cell_type": "code",
|
197 |
| - "execution_count": 108, |
| 128 | + "execution_count": 112, |
198 | 129 | "metadata": {},
|
199 | 130 | "outputs": [
|
200 | 131 | {
|
|
203 | 134 | "{'exact_match': 34.6, 'f1': 51.20063731342978}"
|
204 | 135 | ]
|
205 | 136 | },
|
206 |
| - "execution_count": 108, |
| 137 | + "execution_count": 112, |
207 | 138 | "metadata": {},
|
208 | 139 | "output_type": "execute_result"
|
209 | 140 | }
|
|
0 commit comments