Основными типами современного машинного текстового перевода являются статистический уникальный машинный перевод текста(Statistical Machine Translation или SMT) и перевод «по правилам» (Rule—Based Machine Translation или RBMT).
Переводчик Google Translate использует SMT. Особенностью Google Translate является метод перевода: он не основан на анализе правил грамматики, а основан на поиске соответствий языка между переводимым текстом и гигантским массивом сервиса, который состоит из слов, вносимых пользователем ранее во время их перевода. Данные блоки текста составляются из всех возможных достоверных источников. В качестве примера можно привести документы государственных организаций. Они являются одними из наиболее проверенных источников для базы данных. Преимущество заключается в том, что такие документы содержат информацию, доступную на многих языках.
Также для развития Google Translate важны книги. В настоящий момент известно, что «корпус» Google Translate обладает более чем триллионом слов. Так сервис активно использует пользовательский уникальный перевод для повышения качественных характеристик машинного текстового перевода путем занесения пользовательских варианций фраз в базу данных. Таким образом , такое сочетание способствует увеличению уровня качества генерации уникального текста.
Статистическому современный переводу необходим анализ параллельных языковых пар для осуществления генерации текста. Он самостоятельно приспосабливается к новой лексике. Система самостоятельно заносит в свою совершенную базу данных новые вариации перевода слов или словосочетаний, если они отличаются. Она хранит в памяти новые варианты возможного перевода и может использовать эти версии в будущем. Одним из главных достоинств SMT является то, что он обновляется и развивается параллельно с языком. То есть, если появляется новое слово или меняется его лексическое значение, то система распознает это и обновляет свою базу данных. И, как следствие, ускоряется «обучение» системы и совершенствуется качество генерации текста.
Но есть и значительный недостаток SMT. Этой системе необходимо высокопроизводительное аппаратное обеспечение. Для совершенствования программы требуется огромное число вычислений. Также для перевода SMT характерно то, что качество генерации текста полностью зависит от количества данных в корпусе сервиса. Чаще генерируемые сервисом вариации перевода текста оправдывает возложенные ожидания современного человека. Хотя предсказать заранее текстовое содержание, которое сгенерирует Google Translate, сложно.