Мамандандырылған сөздердiң векторлары арқылы сөздердiң лексикалық тiркесулерiн анықтау
Сот жүйесінде іс қағаздардың ұйымдастырылуына хатшы жауапты болады. Хаттамаларда қате болған жағдайда, келіспеушілік пайда болуы мүмкін. Сондықтан сөздердің дұрыс лексикалық тіркесуі маңызды. Бұл жұмыста ұйқаспайтын сөздерді табу үшін сөздердің лексикалық тіркесулері есептелінді. Сөздердің лексикалы...
Gespeichert in:
Veröffentlicht in: | Vestnik KazNU. Serii͡a︡ matematika, mekhanika, informatika mekhanika, informatika, 2020-09, Vol.107 (3), p.67-73 |
---|---|
Hauptverfasser: | , |
Format: | Artikel |
Sprache: | eng |
Schlagworte: | |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Сот жүйесінде іс қағаздардың ұйымдастырылуына хатшы жауапты болады. Хаттамаларда қате болған жағдайда, келіспеушілік пайда болуы мүмкін. Сондықтан сөздердің дұрыс лексикалық тіркесуі маңызды. Бұл жұмыста ұйқаспайтын сөздерді табу үшін сөздердің лексикалық тіркесулері есептелінді. Сөздердің лексикалық тіркесулері Skip-gram моделімен анықталды. Skip-gram моделі сөздерді векторлармен сипаттайды. Бұл модельде мағынасы жағынан жақын сөздердің және бір-бірімен лексикалық тіркесетін сөздердің векторлары шамамен бір бағытта болулары керек. Сондықтан екі сөздің бір-бірімен лексикалық тіркесуін анықтау үшін сол сөздердің векторларының арасындағы бұрыштың косинусы есептелінді. Косинустың мәні 1-ге жақындаған сайын екі сөздің лексикалық тіркесулері жоғарлайды. Керісінше, косинустың мәні -1-ге жақындаған сайын екі сөздің лексикалық тіркесулері төмендейді. Бұл жұмыста қазақстан Республикасының конституциясының бабының мәтініне жаңа сөз енгізген кезде, авторлардың жүйесі енгізілген сөзді табу керек еді. Жүйе кейбір сөздер үшін жоғары дәлдікті көрсеткенімен, кейбір сөздерде қателіктер табылды. өйткені енгізілген жаңа сөз конституцияның бабына қатысты болмағанымен, көрші сөзбен басқа мәтіндерде тіркесе алады. Мысалы, компьютер сөзі мағынасы жағынан конституцияның бабына қатысты болмағанымен, бұл сөз бұрынғы сөзімен лексикалық тіркесе алады. Берілген жұмыс "Отандық білім беруді модернизациялау жағдайында көптілді іТ маманының құзыретті инновациялық моделін әзірлеу және енгізу" атты гранттық жоба аясында жүзеге асырылынып жатыр. |
---|---|
ISSN: | 1563-0277 2617-4871 |
DOI: | 10.26577/JMMCS.2020.v107.i3.07 |