Недавно мы писали о том, что в Кыргызстане создан проект, цель которого - внедрить кыргызский язык в переводчик Google Translate. Сегодня интернет-редакция "ВБ" представляет вам интервью с координатором проекта "Эне тил" Атаем Жунушевым, который рассказал об этапе работы с представителями корпорации Google Inc., о наполнении словаря "Википедии" - Wiktionary - словами из кыргызского языка, а также о дальнейших планах по развитию проекта.
- Атай, расскажите, пожалуйста, кому пришла идея создать такой проект?
- Не секрет, что для изучения и понимания какого-либо языка необходимо иметь значительную базу словарей. К сожалению, кыргызский язык не имеет большого количества современных словарей, что является одной из причин недостаточного знания языка. Эта проблема обсуждалась особенно активно пользователями социальных сетей, таких, как Facebook и Twitter. Многие из них сошлись во мнении, что эта проблема была бы решена внедрением кыргызского языка в программы компьютерного перевода текста. Одна из самых распространенных программ в Интернете - Google Translate, в настоящее время она поддерживает 64 языка мира, но ни один из языков народов Центральной Азии. Вообще, из всех тюркских языков поддерживаются только два - турецкий и азербайджанский. Несколько из тех пользователей решились самоорганизоваться и создать проект по внедрению кыргызского языка в компьютерные переводчики. Летом они провели переговоры с потенциальными спонсорами проекта. Откликнулись посольство США, фонд "Сорос-Кыргызстан" и сотовый оператор Beeline. Национальный центр информационных технологий предоставил хостинг бесплатно. И в сентябре 2011 года проект "Эне тил" в рамках общественного фонда "Кыргызское интернет-сообщество "Айсок" начал свою работу.
- В чем ценность вашего проекта?
- Многие регионы нашей страны, несмотря на высокую степень проникновения Интернета, все еще оторваны от мирового информационного пространства. Многие испытывают языковой барьер, когда не могут воспринимать информацию, доступную на других языках. А ведь информация на сегодняшний день - это основной фактор развития. Мы убеждены, что население в регионах, получив возможность воспринимать информацию на других языках, будет развиваться быстрее. Ну и мы в то же время получим мощный инструмент перевода текстов на кыргызский язык или же сможем воспринимать тексты на кыргызском языке. В общем, этот проект позволит людям понимать друг друга.
- Расскажите про сотрудничество с корпорацией Google. Как долго вам пришлось решать вопрос необходимости внедрения кыргызского языка в переводчик Google Translate и на каких условиях было достигнуто соглашение?
- Когда начали проект, мы не связывались с командой Google Translate. Получили большую помощь в виде важных рекомендаций от Тилека Мамутова, который работает в компании Google, и использовали справочную информацию о программе. Согласно статье о Google Translate в "Википедии", в первую очередь мы должны были загрузить в базы данных Google Translate более 1 млн слов. Когда мы достигли этой цели, в феврале 2012 года, передали информацию разработчикам Google Translate. Также провели онлайн-видеоконференцию с разработчиками переводчика и обсудили дальнейшие действия по возможному внедрению кыргызского языка. Они объяснили принцип работы переводчика и рассказали про данные, которые он использует. Договорились, что и дальше будем работать вместе. Должен сказать, что ранее появившаяся информация о датах запуска кыргызского языка в Google Translate - неправильная. Мы не можем сказать, как много это займет времени, наша команда продолжает работу над этим проектом и очень оптимистично настроена.
- На одной из пресс-конференций вы упомянули, что представители корпорации Google готовы оказывать вам помощь. В чем именно она заключается?
- Помощь с их стороны - это использование предоставленных нами данных. Команда разработчиков уже провела изучение подготовленных нами текстов и определила, что они соответствуют необходимому уровню качества. Теперь мы будем проводить работу по наполнению словаря "Википедии" - Wiktionary. В настоящее время там всего лишь 3 тыс. слов на кыргызском языке, а мы хотим довести объем до 50 тыс. Конечно, в дальнейшем будем ждать инструкций от команды разработчиков о том, что мы должны еще делать.
- В дальнейшем вы хотите создать интернет-платформу для постоянной поддержки кыргызского языка. Для чего это необходимо?
- Мы бы хотели и дальше развивать этот проект. Если успешно завершим эту миссию по внедрению кыргызского языка в Google Translate, намерены работать в направлении локализации программного обеспечения.
- Вы упомянули про работу над наполнением словаря "Википедия". Насколько мне известно, это второй этап проекта. Расскажите, пожалуйста, есть ли люди, которые уже готовы оказать спонсорскую поддержку, или волонтеры, которые откликнулись, чтобы помогать вам в реализации проекта?
- Вы правы, мы начинаем реализацию второго этапа нашего проекта с работы над Wiktionary. Этот этап будет включать многие мероприятия. Но основная деятельность - это введение слов кыргызского языка в Wiktionary. Мы будем призывать волонтеров через мероприятия. Планируем провести презентации об инструментах Google Translate для студентов вузов и школьников, а также для профессиональных переводчиков. Каждый, кто будет использовать этот инструмент для перевода текстов или статей в "Википедии", будет вносить свой вклад в наш проект по внедрению кыргызского языка в Google Translate. Мы также будем агитировать все организации создавать версии своих сайтов и на кыргызском языке, чтобы робот Google Translate мог использовать эти данные. Мы подали заявку на спонсорство в несколько организаций и сейчас ожидаем от них ответа. Надеемся, они поддержат нашу инициативу. Здесь нужно отметить, что мы не получаем финансирование от компании Google.
- Сколько, по вашим оценкам, потребуется времени, чтобы осуществить задумку с переводом статей на кыргызский язык?
- Мы планируем вводить каждый день минимум по 100 слов в день в Wiktionary, если будут задействованы три переводчика на постоянной основе. За девять месяцев мы надеемся достичь своего показателя эффективности, равного 50 тыс. слов.
- В последнее время в нашей стране очень часто муссируется вопрос о лишении русского языка статуса официального и признании кыргызского единственным официальным и государственным языком. Как вы относитесь к этому вопросу?
- Это уже политический вопрос, и нам хотелось бы дистанцироваться от политики. Вообще, проект "Эне тил" и общественный Фонд "Айсок" созданы для пользы общественности, мы вне политики. Поэтому я попробую ответить на ваш вопрос кратко и ясно. Общеизвестно, чем большим количеством языков мы владеем, тем богаче интеллектуально мы становимся. Должны быть условия, когда все будут владеть как минимум двумя языками, а лучше и тремя. И поэтому в свете глобализации каждый гражданин Кыргызстана будет просто обязан говорить на кыргызском, русском и английском языках, если мы хотим выжить и развиваться. Это должно стать визитной карточкой нашей гибкости и динамичности в XXI веке. А вопрос статуса того или иного основного языка - это дело политики, и наш проект такие вопросы не решает.
- Расскажите о дальнейших планах вашей организации.
- Параллельно со второй фазой проекта "Эне тил" мы начали реализацию проекта "КУТ Тест" - универсальный тест кыргызского языка. Мы хотим создать компьютерную программу тестирования знаний по кыргызскому языку. Каждый житель Кыргызстана или иностранец сможет проверить уровень своего владения кыргызским языком через независимую, удобную и прозрачную систему, гарантирующую качественные показатели для работодателей и учебных заведений - при приеме на работу или учебу. Надеемся, в конце года сможем представить свой продукт на суд общественности.
- Спасибо, Атай, за интервью. Желаем успехов вашему проекту.