Определить области текста на скриншоте

Question

Определить области текста на скриншоте

1

Я работаю над проектом, чтобы повысить способность вина автоматически тестировать пакеты программного обеспечения. То, что я сейчас ищу, - это обнаружение текста при захвате экрана текущего окна. Затем я могу разобрать весь текст и использовать autohotkey, чтобы щелкнуть мышью по координатам текста, который я хочу.

Например, в firefox мне может понадобиться протестировать разные вещи, причем первые открывают открывающиеся настройки. Затем мне нужно было бы проанализировать скриншот firefox, обнаружить все отдельные местоположения текста. Затем я могу запустить эти отдельные изображения текста в tesseract-ocr и определить, какой из них говорит "Изменить". Затем я повторю это снова для "предпочтений".

Я пытался найти решение, но до сих пор ничего не могу найти. Я бы предпочел решение, которое использует python или связывает python как то, что я программировал до сих пор.

Shelnutt2 23 март 2011, в 15:17

Источник

0

Вам не нужно какое-то решение оптического распознавания символов для правильного разбора текста? Другими словами, как вы собираетесь получить текст с изображения?
reckoner 31 март 2011, в 15:56

Теги:

python

image-processing

linux

ocr

2 ответа

0

Посмотрите эту ссылку http://www.testandtry.com/2010/02/01/5-great-automation-tools-based-on-image-recognition/ Но для меня лучше использовать OpenCV и Python;)

woto 14 нояб. 2011, в 13:59

Ещё вопросы

Вам не нужно какое-то решение оптического распознавания символов для правильного разбора текста? Другими словами, как вы собираетесь получить текст с изображения?

Giuseppe Cardone · Accepted Answer · 2011-03-23T11-36-00.000Z

Возможной отправной точкой является Project SIKULI. Это инструмент для автоматизации тестирования графического интерфейса. Он написан на Java, тем не менее он включает среду сценариев на основе Jython, поэтому ее модификация для поддержки python script может быть не слишком сложной.