Google відкриває джерела свого англомовного аналізатора Parsey McParseface

  • Oct 20, 2023

Parsey McParseface — це англомовний плагін у фреймворку нейронної мережі SyntaxNet із відкритим кодом Google.

Boaty McBoatface, знайомтесь з Parsey McParseface.

Гаразд, Boaty McBoatface насправді ніколи не став назвою нового полярного дослідницького судна британського уряду, але це не завадило технологічному гіганту Google використовувати власну версію псевдонікера для своєї нової відкритої англійської мови аналізатор.

Рекомендовані

  • Чи Windows 10 надто популярна?
  • 5 способів знайти найкраще місце для початку кар’єри
  • Ось як генеративний ШІ змінить економіку концертів на краще
  • 3 причини, чому я віддаю перевагу цьому Android за 300 доларів, ніж Pixel 6a від Google

Зокрема, Google сьогодні випускає SyntaxNet, його структура нейронної мережі з відкритим кодом, реалізована в TensorFlow. Сьогоднішній випуск містить увесь код, необхідний для навчання нових моделей SyntaxNet, а також Parsey McParseface, який, по суті, є англомовним модулем для SyntaxNet.

Google каже, що SyntaxNet забезпечує основу для її систем розуміння природної мови (NLU), наприклад, можливостей розпізнавання голосу Google Now. Google пояснив, що Parsey McParseface побудовано на основі алгоритмів машинного навчання, які працюють для аналізу мовних структуру мови, щоб зрозуміти функціональну роль кожного слова та граматичного будівельного блоку в a речення.

«Одна з головних проблем, яка робить розбір таким складним, полягає в тому, що людські мови демонструють вражаючий рівень неоднозначності», — Google пояснюється в дописі в блозі. «Нерідко речення середньої довжини — скажімо, 20 або 30 слів — містять сотні, тисячі або навіть десятки тисяч можливих синтаксичних структур. Синтаксичний аналізатор природної мови повинен якимось чином шукати всі ці альтернативи та знаходити найбільш правдоподібну структуру в контексті».

Google стверджує, що Parsey McParseface досяг 94-відсоткової точності, коли йому поставили завдання щодо статей новин англійською мовою. Хоча точність не є ідеальною, Google наполягає на тому, що вона достатньо висока, щоб бути корисною в низці програм. Це тому, що правильна інтерпретація граматичної структури речення має вирішальне значення, якщо комп’ютер має належним чином реагувати на значення речення.