Форум СЛОВНИК.НЕТ

Привіт, гостю ( Вхід | Реєстрація )

 
Відповісти в цю темуВідкрити нову тему
> LanguageTool 0.8.9
Andriy
повідомлення 12.4.2007, 13:56
Повідомлення #1


Генератор ідей
*****

Група: Користувачі
Повідомлень: 485
Реєстрація: 10.11.2006
Користувач №: 11
Подякували: 199



Репутація:   8  


http://www.danielnaber.de/languagetool/

ПЗ перевірки граматики, версія 0.8.9 включає початкову підтримку української мови:
- деякі правила пунктуації: виокремлення комами "будь ласка", деяких вставних слів, кома перед "але"...
- спроба започаткувати перевірку милозвучності (в/у) (поки що дуже експериментальна)
- виловлювання деяких калькувань, напр., співпадати->збігатися...
а також деякі, спільні для всіх мов: парність дужок, дві коми, прогалина перед комою...

Засіб існує у вигляді розширення для OpenOffice.org, а також окремі версії: командного рядка, версія з GUI, а також у вигляді сервера http.

Підтримка української мови потребує допомоги, ласкаво просимо всіх бажаючих!

Наразі створено сторінку проекту для роботи над базою знань про українську мову, яка могла б служити вихідною точкою для проектів перевірки орфографії *spell-uk, граматики в LanguageTool та потенційно будь-якого іншого застосування в галузі лінгвістики.


--------------------
Вареники? Оце я тяжко люблю!
Користувач в офлайніКартка користувачаВідправити особисте повідомлення
Повернутися на початок сторінки
+Відповісти з цитуванням даного повідомлення
Основознавець
повідомлення 1.8.2008, 1:29
Повідомлення #2


Юний плюрилінгвіст
*******

Група: Користувачі
Повідомлень: 961
Реєстрація: 1.8.2008
З: Львів.
Користувач №: 1 913
Подякували: 615



Репутація:   8  


Вельми цікава річ, справді, але залишається цікавим одне: чому це не реалізувати в *Spell-двигун? А ускладнювати додатковою програмою? Звісно, зрозуміло, що це лише розширення для OpenOffice.org і воно не має вагомого значення. Якби це було у рамках *Spell-uk, то я б взяв якусь участь.


--------------------
Кою помилки, щоб залишились сліди.
Користувач в офлайніКартка користувачаВідправити особисте повідомлення
Повернутися на початок сторінки
+Відповісти з цитуванням даного повідомлення
Andriy
повідомлення 1.8.2008, 3:27
Повідомлення #3


Генератор ідей
*****

Група: Користувачі
Повідомлень: 485
Реєстрація: 10.11.2006
Користувач №: 11
Подякували: 199



Репутація:   8  


Цитата(Основознавець @ 1.8.2008, 2:29) *

Вельми цікава річ, справді, але залишається цікавим одне: чому це не реалізувати в *Spell-двигун? А ускладнювати додатковою програмою? Звісно, зрозуміло, що це лише розширення для OpenOffice.org і воно не має вагомого значення. Якби це було у рамках *Spell-uk, то я б взяв якусь участь.

проблема в тому, що двигуни перевірки орфографії заточені під перевірку орфографії, вони перевіряють лише слова, тобто для перевірки граматики вони аж ніяк
словники для перевірки орфографії є лише переліком слів з правилами відмінювання (для нормалізації)

для перевірки граматики, окрім правильних форм слів, треба їх частини мови, час, особу, правила узгодження, правила розташування слів в реченні, правила пунктуації…

поточно, на базі spell-uk можна побудувати досить потужну базу для корпусу, що буде використовуватися для перевірки граматики в LT, але окрім того треба буде написати на xml купу правил української мови…

якщо Вас таке зацікавить буду радий і можу допомогти


--------------------
Вареники? Оце я тяжко люблю!
Користувач в офлайніКартка користувачаВідправити особисте повідомлення
Повернутися на початок сторінки
+Відповісти з цитуванням даного повідомлення
Основознавець
повідомлення 1.8.2008, 12:58
Повідомлення #4


Юний плюрилінгвіст
*******

Група: Користувачі
Повідомлень: 961
Реєстрація: 1.8.2008
З: Львів.
Користувач №: 1 913
Подякували: 615



Репутація:   8  


Цитата(Andriy @ 1.8.2008, 4:27) *
поточно, на базі spell-uk можна побудувати досить потужну базу для корпусу, що буде використовуватися для перевірки граматики в LT, але окрім того треба буде написати на xml купу правил української мови…

якщо Вас таке зацікавить буду радий і можу допомогти
Геть нічорта не зрозумів стосовно взаємозв'язку spell-uk та LT, але якщо Ви мали на увазі написати на xml правила до spell-uk на основі LT, тоді я за! Поясніть більш детально, будь ласка. Гадаю, що можна таким потужним проектом й зайнятись, — основна ідея програми дуже подобається. Хоча з часом скрутно, але повзання також рухwink.gif
Якщо Вам легше — можете написати у приватні повідомлення.


--------------------
Кою помилки, щоб залишились сліди.
Користувач в офлайніКартка користувачаВідправити особисте повідомлення
Повернутися на початок сторінки
+Відповісти з цитуванням даного повідомлення
Andriy
повідомлення 1.8.2008, 20:41
Повідомлення #5


Генератор ідей
*****

Група: Користувачі
Повідомлень: 485
Реєстрація: 10.11.2006
Користувач №: 11
Подякували: 199



Репутація:   8  


Цитата(Основознавець @ 1.8.2008, 13:58) *

Геть нічорта не зрозумів стосовно взаємозв'язку spell-uk та LT, але якщо Ви мали на увазі написати на xml правила до spell-uk на основі LT, тоді я за! Поясніть більш детально, будь ласка. Гадаю, що можна таким потужним проектом й зайнятись, — основна ідея програми дуже подобається. Хоча з часом скрутно, але повзання також рухwink.gif
Якщо Вам легше — можете написати у приватні повідомлення.

для того, щоб правила були корисні треба спочатку побудувати базу слів з їх атрибутами, оскільки це краще робити на базі словників spell-uk я можу цим зайнятися, щоб ви могли просто працювати з правилами...
в будь-якому разі вам варто ознайомитися з коротким описом ось тут і поставити собі LT
я спробую на вихідних підготувати базу слів і запхнути її в репозитарій LT, щоб зразу можна було з ними працювати

якщо будуть питання по правилах — пишіть, в приват не знаю чи варто, можливо хтось ще зацікавиться

також якщо треба буде коротший шлях спілкування лишіть контакт IM в приваті, тоді можна буде спілкуватися онлайн


--------------------
Вареники? Оце я тяжко люблю!
Користувач в офлайніКартка користувачаВідправити особисте повідомлення
Повернутися на початок сторінки
+Відповісти з цитуванням даного повідомлення
Основознавець
повідомлення 2.8.2008, 10:12
Повідомлення #6


Юний плюрилінгвіст
*******

Група: Користувачі
Повідомлень: 961
Реєстрація: 1.8.2008
З: Львів.
Користувач №: 1 913
Подякували: 615



Репутація:   8  


Гаразд, встановив собі я цю програму звантаживши з та надибав відразу деякий недолік. Як я зрозумів, там вже були Ваших пару правил. Отже, я використав варіант "Реабілітувався в Львівському". При тому вона мені пропонувала вилучити "в львівському", замінивши на "у". Я збагнув, що це помилка правил, але, що саме смішне, його немає в grammar.xml .Тут є знімок.
Щодо інтерфейсу, то він доволі приємний. Та й є питання: Що то за replace.txt, що лежить поряд з grammar.xml?
Ще мене цікавить, чи можливо вводити правила не до кожного слова, а лише до комбінації останніх та перших літер?

І ще одне, щось він довго працює.


--------------------
Кою помилки, щоб залишились сліди.
Користувач в офлайніКартка користувачаВідправити особисте повідомлення
Повернутися на початок сторінки
+Відповісти з цитуванням даного повідомлення
Andriy
повідомлення 2.8.2008, 17:47
Повідомлення #7


Генератор ідей
*****

Група: Користувачі
Повідомлень: 485
Реєстрація: 10.11.2006
Користувач №: 11
Подякували: 199



Репутація:   8  


Цитата(Основознавець @ 2.8.2008, 11:12) *

Гаразд, встановив собі я цю програму звантаживши з та надибав відразу деякий недолік. Як я зрозумів, там вже були Ваших пару правил. Отже, я використав варіант "Реабілітувався в Львівському". При тому вона мені пропонувала вилучити "в львівському", замінивши на "у". Я збагнув, що це помилка правил, але, що саме смішне, його немає в grammar.xml .Тут є знімок.
Щодо інтерфейсу, то він доволі приємний. Та й є питання: Що то за replace.txt, що лежить поряд з grammar.xml?
Ще мене цікавить, чи можливо вводити правила не до кожного слова, а лише до комбінації останніх та перших літер?

І ще одне, щось він довго працює.

1. там лише декілька правил і це була здебільшого проба пера, тобто ці правила треба міняти
2. правило, на яке ви наштовхнулись там у grammar.xml:
<rule>
<pattern>
<token regexp="yes">.*[аеєиіїоуюя]</token>
<token regexp="yes">у</token>
<token regexp="yes" negate="yes">в.*</token>
</pattern>
<message>Зіяння <suggestion>\1 в</suggestion></message>
<example type="correct">Балка в степу.</example>
<example type="incorrect"><marker>Балка у степу</marker>.</example>
</rule>
3. так можна, треба використовувати атрибут regexp, власне, правило вгорі і є таким прикладом — воно намагається узгоджувати в/у з кінцевою голосною попереднього слова

щодо довго працює, я подивлюсь чи це від того, що для української зараз не вживається FSA, а береться сирий словник spell-uk, якщо це так, то це буде виправлено


--------------------
Вареники? Оце я тяжко люблю!
Користувач в офлайніКартка користувачаВідправити особисте повідомлення
Повернутися на початок сторінки
+Відповісти з цитуванням даного повідомлення
Andriy
повідомлення 2.8.2008, 18:36
Повідомлення #8


Генератор ідей
*****

Група: Користувачі
Повідомлень: 485
Реєстрація: 10.11.2006
Користувач №: 11
Подякували: 199



Репутація:   8  


4. replace.txt - це була спроба створити простіший формат (без громіздкого xml) для простої заміни слів, здебільшого русизмів, але я не впевнений, що він лишиться


--------------------
Вареники? Оце я тяжко люблю!
Користувач в офлайніКартка користувачаВідправити особисте повідомлення
Повернутися на початок сторінки
+Відповісти з цитуванням даного повідомлення

Відповісти в цю темуВідкрити нову тему
2 люд. читає цю тему (гостей: 2, прихованих користувачів: 0)
Користувачів: 0

 



Текстова версія Зараз: 19.10.2019, 11:27