Выберите регион
Global Web Site - English
North America - English
Western Europe - English
Western Europe - Deutsch
Western Europe - Français
Western Europe - Italiano
Russia - Русский
Ukraine - Русский
Australia - English
Czech Republic - Čeština
Slovakia - Slovenský
China - 简体中文
Greece - Ελληνικά
Brazil - Português
South America - Español
Turkey - Türkçe
ABBYY Labs – это образовательный IT-проект от ABBYY, в котором группы студентов под руководством сотрудников компании решают реальные задачи, стоящие перед разработчиками в компании. Процесс работы организован следующим образом: основная задача проекта делится на подзадачи, каждую из которых будет решать определенная команда. Внутри команды тоже есть свое деление: каждый участник берет на себя определенную роль, которую и выполняют в течение хода всего проекта. За деятельностью ребят следит сотрудник компании, который делится теоретическими знаниями и практическими навыками, а помогает ему в этом HR-специалист.
Один такой проект под названием MathOCR уже реализован в МФТИ в рамках годового технического курса «Инновационный практикум», где ребята занимаются разработкой программного модуля распознавания формул. В этом году мы предлагаем два новых проекта: создание лингвистических игр на основе технологий ABBYY и разработка вопросно-ответной системы как готового приложения для поиска информации по FAQ. Первый из которых будет вести куратор Math OCR Андрей Андрианов, а второй – сотрудник компании Алексей Штукатуров. Стоит отметить, что ABBYY планирует создание малого инновационного предприятия на основе проекта с лингвистическими играми.
Мы стараемся максимально приблизить условия работы участников проекта к реальным. Ведь задача ABBYY Labs состоит не только в развитии навыков программирования у студентов, но и умения работать в команде, что, несомненно, пригодится в будущей работе участников проекта. В ABBYY Labs могут принять участие не только физтехи, но студенты других вузов, а также школьники и аспиранты. Студенты МФТИ могут зачесть себе участие в ABBYY Labs как семестровый или годовой технический курс по выбору.
Если у Вас появилось желание присоединиться к нашему проекту, пишите на brains@abbyy.com.
Math OCR – студенческий проект от ABBYY Labs, реализованный в МФТИ в рамках годового технического курса «Инновационный практикум». У ребят стоит очень непростая, но интересная задача: разработка целого программного модуля, предназначенного для распознавания формул, будь то математических, либо химических.
Над проектом работает две команды: первая занималась непосредственно анализом, то есть поиском формул на изображении, а вторая – распознаванием и экспортом распознанных формул в систему верстки TeX. Ребята разработали модуль, корректирующий распознавание формул ABBYY FineReader, а также линию дроби. В ходе проекта студенты решили целый ряд задач, связанных с анализом, распознаванием и экспортом. Так, в анализе самым сложным было научить программу выделять прямоугольник, в котором точно содержится формула. В распознавании – улучшить «понимание» взаимного расположения символов (обычный распознаватель ориентируется на строки текста, а математическая формула может быть «многоэтажной» и расширять строку, причём даже банальные два «этажа» дроби могут ставить обычный распознаватель в тупик).
Как мы уже говорили, участники Math OCR учились не только программировать, но и планировать работы по проекту, а также представлять его результаты «заказчику». Отчетные презентации студенты представили экспертной комиссии, в которую вошли лучшие специалисты компании в области распознавания. Финальная презентация состоялась 22 декабря прошлого года. Участники проекта, несмотря на зачетную сессию, приехали в офис, чтобы рассказать о том, что у них получилось.
Своими впечатлениями с нами поделился руководитель группы анализа документов технологического департамента ABBYY и член экспертной комиссии Дмитрий Дерягин: «Двум студенческим командам пришлось на своём опыте почувствовать всю неидеальность мира разработки, когда каждая сторонняя программа работает не так, как хочется, когда все предположения о входных данных выполняются только при большом количестве дополнительных условий, когда условия подзадачи нужно уточнять в процессе её решения. И многие идеи, которые до разработки казались красивыми и работающими, часто пасуют при встрече с суровой реальностью. Тем не менее, пройдя через это, студенты смогли представить прототипы своих программ. Но после первой череды испытаний началась следующая. В реальном мире корректное измерение качества работы само по себе является непростой задачей, которая под силу далеко не каждому. Студенты продемонстрировали свои попытки решить эту задачу. Может быть, получилось не всё, что хотелось, но главное – не сдаваться».
Как рассказал нам руководитель проекта Андрей Андрианов, за время проекта команды научились слаженно работать, а некоторые ребята проявили лидерские качества, о которых даже не подозревали. Сами участники Math OCR очень довольны своими результатами: они освоили основные инструменты разработки и получили опыт в программировании, отличный от программирования в рамках занятий на Физтехе, а это самый важный результат!
Читайте также об ABBYY Labs на нашем хаброблоге.
Если у вас возникли вопросы о проектах, то присылайте их на brains@abbyy.com. Мы с радостью на них ответим!