domnenko@mail.ru, telegram: @domnenko_a_n
Colab: https://colab.research.google.com/drive/1rE8fr8ie0aby6sfKi99v8hgpRHxp-_1s?usp=sharing
Сегментация текстов договоров, поиск сущностей.
Для обучения модели используется датасет, состоящий из 423 договоров, размеченным на на сегменты тегами:
Теги:
<s1> - Условия
<s2> - Запреты
<s3> - Цена
<s4> - Условия (относительно дат)
<s5> - Штрафы
<s6> - Адреса и местоположения
Для исследования вытирали модели нейронных сете:
-
Conv1D (полносвязная, прямого распространения)
-
PSPnet
-
Unet
На малых эпохах обучения лидировала Conv1D сеть, на больших Unet