Файл тестирования Sentence Splitter

1

Я ищу тестовый файл для моего приложения Sentence Splitter, и я надеюсь, что файл может охватывать как можно больше случаев.

Спасибо!

  • 0
    Как ваши чувства должны быть разделены, и на каких условиях?
  • 0
    Язык английский. Алгоритм разбивает текст на основе заглавных / строчных букв, знаков препинания или языковой грамматики. Это сложный алгоритм, поэтому я хотел бы проверить его в как можно большем количестве случаев. Очень простой пример - предложение «Доктор Джон сказал, что его идентификационный номер не 3,1415». должно быть в одном предложении, но случай на stackoverflow.com/questions/1936388/… должен быть разбит на 6 предложений.
Теги:

1 ответ

6
Лучший ответ

Прочитайте документацию для Lingua::Sentence. Он называет корпус, который он использует, а также связанные модули разделения предложений. Просматривайте тестовые файлы.

  • 0
    Спасибо! Отличный ресурс.

Ещё вопросы

Сообщество Overcoder
Наверх
Меню