Определить области текста на скриншоте

1

Я работаю над проектом, чтобы повысить способность вина автоматически тестировать пакеты программного обеспечения. То, что я сейчас ищу, - это обнаружение текста при захвате экрана текущего окна. Затем я могу разобрать весь текст и использовать autohotkey, чтобы щелкнуть мышью по координатам текста, который я хочу.

Например, в firefox мне может понадобиться протестировать разные вещи, причем первые открывают открывающиеся настройки. Затем мне нужно было бы проанализировать скриншот firefox, обнаружить все отдельные местоположения текста. Затем я могу запустить эти отдельные изображения текста в tesseract-ocr и определить, какой из них говорит "Изменить". Затем я повторю это снова для "предпочтений".

Я пытался найти решение, но до сих пор ничего не могу найти. Я бы предпочел решение, которое использует python или связывает python как то, что я программировал до сих пор.

  • 0
    Вам не нужно какое-то решение оптического распознавания символов для правильного разбора текста? Другими словами, как вы собираетесь получить текст с изображения?
Теги:
image-processing
ocr

2 ответа

1
Лучший ответ

Возможной отправной точкой является Project SIKULI. Это инструмент для автоматизации тестирования графического интерфейса. Он написан на Java, тем не менее он включает среду сценариев на основе Jython, поэтому ее модификация для поддержки python script может быть не слишком сложной.

0

Посмотрите эту ссылку http://www.testandtry.com/2010/02/01/5-great-automation-tools-based-on-image-recognition/ Но для меня лучше использовать OpenCV и Python;)

Ещё вопросы

Сообщество Overcoder
Наверх
Меню