Набор текста голосом: проверенные программы и онлайн-сервисы
Развитие технологий распознавания голоса даёт пользователям новые возможности для взаимодействия с различными устройствами. Мы постепенно привыкаем к голосовым помощникам, но с помощью голоса можно не только узнавать погоду или включать музыку, но и набирать большие объёмы текста.
Что такое голосовой ввод текста
Голосовой ввод текста — это функция, основанная на технологии распознавании речи. Программа голосового ввода воспринимает произнесенные слова и преобразует их в письменный текст.
Не стоит путать голосовой ввод с голосовым управлением. Вторая технология упрощает пользователю выполнение каких-либо действий на устройстве — например, включает музыку или запускает приложения без помощи рук. Голосовой же ввод решает более узкую задачу — набор текста с помощью голоса.
Голосовой ввод применим в разных ситуациях:
- для перевода аудиофайлов в текстовый формат — например, для расшифровки интервью или записи лекции;
- для сохранения в файл большого объёма устного текста, ведь говорим мы намного быстрее, чем печатаем;
- для преодоления физических ограничений, при которых нет возможности набирать текст на клавиатуре.
Для использования голосового ввода нужен лишь микрофон. Владельцы ноутбуков могут использовать микрофон, встроенный в аппарат, а владельцы стационарных компьютеров — тот, что есть в веб-камерах, которые подключаются к ПК.
В принципе, для голосового ввода подойдёт любой микрофон, если говорить чётко и не очень быстро. Особой настройки оборудования тоже не требуется. Достаточно убедиться в том, что система воспринимает звук через микрофон.
Проверка и настройка микрофона
Прежде всего подключите микрофон к компьютеру. Если вы хотите использовать встроенное устройство ноутбука или веб-камеры, то ничего подключать не надо. Затем найдите на панели уведомлений значок динамика. Он может быть спрятан под галочкой.
Кликните по значку динамика правой кнопкой и выберите пункт «Записывающие устройства». Это откроет список оборудования, которое можно использовать для записи звука. В этом списке должен быть и ваш микрофон вне зависимости от того, подключен он отдельно или встроен в ноутбук.
Если в списке записывающих устройств пусто, кликните на свободном месте правой кнопкой мышки и отметьте пункты «Показывать отключенные устройства» и «Показывать отсоединенные устройства». После того как микрофон появится в списке, откройте правым кликом его меню и выберите опцию «Включить». Также убедитесь, что он назначен устройством по умолчанию.
Удостовериться в том, что система воспринимает звук с микрофона, очень просто: скажите в него что-нибудь. Если справа появляются зелёные полосы, значит всё готово к голосовому вводу. Попробуйте говорить тише или громче — вы заметите, как количество зелёных полос меняется в зависимости от громкости голоса.
При желании можно попробовать изменить стандартные параметры микрофона, добившись некоторого улучшения качества записи. Для этого:
- Кликните правой кнопкой по микрофону.
- Откройте его свойства.
- Перейдите на вкладку «Уровни».
- Поставьте максимальные значения громкости и усиления.
- Откройте вкладку «Улучшения».
- Включите подавление шума и эхо.
Количество опций для улучшения зависит от того, какая звуковая карта установлена на вашем компьютере. К сожалению, некоторые из них не имеют вообще никаких параметров для настройки, кроме управления громкостью и усилением. Но для голосового ввода это не критично — главное, чтобы система в принципе воспринимала звук через микрофон.
Программы для голосового ввода
Если вы планируете пользоваться голосовым вводом постоянно, то самое удобное решение — установить одну из программ, которая предоставляет такую возможность.
Dictate для MS Office
В 2017 году разработчики Microsoft выпустили дополнение Dictate. Оно доступно для бесплатной установки на Windows 8.1/10 в пакетах MS Office 2013 и старше. После инсталляции Dictate в Word, PowerPoint и Outlook появляется дополнительный раздел, позволяющий включить микрофон и использовать распознавание речи для начитки текста.
Спустя некоторое время Microsoft прекратила поддержку дополнения, интегрировав функцию распознавания речи в Office 365 и Windows 10. Если вы используете эту версию пакета приложений, то можете без труда наговорить любой текст через микрофон.
Как это сделать:
- Откройте Word.
- Нажмите сочетание клавиш Win+H.
- Кликните по значку микрофона и диктуйте текст.
Распознавание работает только в том случае, если в «Параметрах» включена соответствующая функция:
Несмотря на заявленную поддержку русского языка, качество его распознавания оставляет желать лучшего. Программа правильно записывает простые фразы, но на сложных предложениях часто спотыкается. Поэтому не стоит даже надеяться на то, что вы будете говорить безостановочно — для получения приемлемого результата необходимо делать паузы и чётко проговаривать все окончания. Распознавание аудиофайлов здесь не поддерживается — для этого нужны другие программы.
Расширение Dictate больше нельзя скачать с официальной страницы Microsoft, но оно осталось на других сайтах. Однако загрузка из сторонних источников может быть опасной из-за вирусной угрозы. Если у вас нет подписки на Office 365, то рекомендуем использовать другие программы для голосового набора текста.
MSpeech
MSpeech — простая программа для обработки речи и превращения голосового потока в текст, способная распознавать более 50 языков, среди которых русский.
После установки и запуска она сворачивается в системный трей. Чтобы вызвать её оттуда, кликните правой кнопкой мышки по иконке программы и выберите опцию «Показать».
Для управления записью здесь используются две кнопки — «Начать» и «Остановить».
Самые важные функции программы скрыты в её настройках. Нажмите на одноимённую кнопку, чтобы перейти в этот раздел. Здесь вы можете:
- Включить автозапуск приложения вместе с системой.
- Выбрать основной и дополнительный языки распознавания.
- Задать собственные команды для запуска других программ. Например, по ключевому слову «интернет» будет открываться Mozilla Firefox.
- Назначить горячие клавиши для управления записью.
- Включить передачу текста в другие программы: редакторы, офисные приложения, браузеры и т.д.
Для работы MSpeech требуется подключение к Интернету, так как программа использует Google Voice API.
Speechpad
Speechpad — это сервис, который можно использовать в браузере или интегрировать с операционными системами Windows и Linux для добавления голосового ввода в другие программы — например, «Блокнот» или офисные приложения.
Если вы хотите пользоваться голосовым вводом в Google Chrome, в том числе набирать сообщения и заполнять другие формы, сделайте следующее:
- Установите в Chrome расширение Speechpad.
- После инсталляции кликните по значку дополнения на верхней панели, чтобы открыть его настройки.
- Выберите язык голосового ввода.
- Нажмите «Save» и перезапустите браузер.
- Откройте любой сайт с текстовой формой. Это может быть поисковая строка Яндекса или диалог в соцсети.
- Кликните по полю правой кнопкой и выберите опцию «Speechpad».
Если голосовой ввод поддерживается, то форма окрасится в розовый цвет. Также вам нужно дать разрешение на использование микрофона, после чего вы можете диктовать текст.
Чтобы расширить действие сервиса на другие приложения Windows, необходимо установить дополнительный модуль интеграции.
- Скачайте модуль и распакуйте архив.
- Запустите файл install_host.bat.
в голосовом блокноте.
- Авторизуйтесь в кабинете пользователя и нажимаем на кнопку «Включить тестовый период».
- Откройте сайт голосового блокнота.
- Отметьте пункт «Интеграция с OS».
- Нажмите «Включить запись».
- Запустите любое приложение с текстовым редактором (например, Word) и диктуйте текст.
Интеграция с системой — платная услуга. Проверить её работу можно без покупки лицензии, но для постоянного использования требуется подписка: месяц — 100 рублей, 3 месяца — 250 рублей, 1 год — 800 рублей.
Voco — платное Windows-приложение для распознавания речи и преобразования её в текстовый формат. Оно даже поддерживает расстановку знаков препинания с помощью специальных команд.
Для проверки орфографии эта программа использует встроенные словари. Кроме того, вы можете научить её новым выражениям, открыв доступ к вашим письмам и документам.
- Basic — 1718 рублей. Бесплатные обновления в течение 1 года. Продление подписки на апдейты — 559 рублей ежегодно.
- Professional — 14 136 рублей. Продление подписки на обновления — 4937 рублей ежегодно.
- Enterprise — от 50 749 рублей. Продление подписки на обновления — 17 786 рублей ежегодно.
Для домашнего использования оптимально подходит Voco.Basic. Однако в ней нет распознавания аудиозаписей и тематических словарей. Эти возможности доступны только в старших версиях.
Веб-сервисы и приложения для голосового ввода
Для использования голосового ввода от случая к случаю можно обойтись без установки на компьютер специальных программ. Скорее всего, вам будет достаточно возможностей веб-сервисов и расширений для браузера.
Google Docs
Простой инструмент голосового ввода есть в Google Docs — сервисе для работы с текстовыми документами. Для его использования достаточно иметь аккаунт почты Gmail.
Как пользоваться голосовым вводом в Google Docs:
- Откройте сайт поисковой системы Google.
- Авторизуйтесь под своей учётной записью Google или зарегистрируйте новый профиль.
- Кликните по квадрату из точек, чтобы раскрыть меню с сервисами.
- Нажмите «Ещё», чтобы увидеть полный список.
- Перейдите в «Документы».
- В поле «Создать документ» нажмите «Пустой файл».
На экране появится текстовый редактор Google. Чтобы включить голосовой ввод, раскройте меню «Инструменты» и выберите соответствующую опцию. Слева появится виджет с микрофоном. Выберите в нём язык, на котором вы будете говорить, а затем нажмите на иконку микрофона, чтобы включить распознавание. Значок должен стать красным. Если браузер запросит разрешение на использование микрофона, дайте его.
Запуск голосового ввода доступен также с помощью сочетания клавиш Ctrl+Shift+S. Функция запускается с языком, установленным по умолчанию.
После настройки начинайте говорить — Google Docs будет распознавать речь и превращать её в текст. Знаки препинания и новую строку проговаривайте словами, чётко произносите окончания слов — в противном случае исправлять текст придётся очень долго.
Speechpad
Speechpad — бесплатный сервис, который работает только в браузере Chrome. Выше мы рассказали, как настроить его интеграцию с Windows. Однако для набора небольшого фрагмента текста в этом нет необходимости — с задачей отлично справится веб-интерфейс голосового блокнота.
- Откройте сайт Speechpad.ru.
- Пролистните главную страницу до окна редактора.
- Выберите язык ввода.
- Нажмите на кнопку «Включить запись» и разрешите использование микрофона.
- Диктуйте текст.
Возле кнопки «Включить запись» вы увидите поле предварительного показа. В нём отображается то, что будет добавлено в документ.
Расставлять знаки препинания и переходить на новую строку можно голосом или кнопками, которые находятся между полем предварительного просмотра и редактором. При наведении на каждую кнопку появляется текст голосовой команды, к которой она применяется — например, «вопросительный знак» или «открыть скобку».
Итоговый документ доступен для скачивания в формате TXT.
VoiceNote
VoiceNote — ещё один сервис для преобразования голоса в текст, который работает только в Google Chrome. При попытке запустить его в другом браузере появляется сообщение об ошибке.
Для голосового ввода через VoiceNote можно использовать Live Demo или отдельное приложение для Chrome.
Как пользоваться VoiceNote:
- Откройте редактор.
- Нажмите на значок в виде земного шара и выберите язык ввода.
- Кликните по иконке микрофона.
- Разрешите использование записывающего устройства.
- Диктуйте текст.
Правила ввода здесь стандартные: знаки препинания можно проговаривать словами, а также голосом отправлять текст на новую строчку.
Полученный документ доступен для сохранения в формате TXT.
TalkTyper
TalkTyper — онлайн-редактор для голосового ввода. Главное его достоинство — поддержка 37 языков. Однако TalkTyper, как и предыдущие сервисы, работает только в Google Chrome.
Принцип ввода текста в этом редакторе не отличается от других: вы указываете язык, нажимаете на значок микрофона и разрешаете его использование. Знаки препинания и новая строка проговариваются словами.
Результат обработки текста в TalkTyper можно сохранить в виде документа в формате TXT, скопировать в буфер обмена, распечатать, отправить по почте, твитнуть и перевести на другой язык.
Voice Notepad
Voice Notepad — ещё один сервис для преобразования голоса в текст, работающий только в Chrome. Он поддерживает больше 120 языков ввода. В остальном функциональность у него такая же, как у сервисов, перечисленных выше: расстановка знаков препинания голосом, сохранение документа в формате TXT, копирование в буфер обмена, отправка по почте или на печать и т.д.
Особенность онлайн-сервисов заключается в том, что все они работают только в Google Chrome. Это связано с тем, что в их основе лежит лицензионная гугловская технология распознавания речи. Другие браузеры её не поддерживают или поддерживают с ограничениями. Например, Speechpad можно запускать в Яндекс.Браузере, однако в чужеродной среде он часто работает с ошибками. Так что если вы не пользуетесь Google Chrome, проще всего установить одну из программ для голосового ввода на компьютер и забыть про неудобства.
Как разговаривать в микрофон: советы профессионала
Конечно, профессионалы делают это постоянно; радио, телевидение, ораторы и даже агенты телемаркетинга знают, как сформулировать звуковые слова, которые мы слышим, и манипулировать ими. Но «обычные» люди, оказавшиеся перед микрофонами, должны уметь «говорить», чтобы их аудитория могла слышать и понимать сообщения.
Вы когда-нибудь входили в проезжую часть ресторана быстрого питания, где просто не понимали, что выходит из динамика? Сотрудник ресторана сказал: «Яда, яда, яда», но все, что вы слышали, было «бла-бла-бла». Когда это происходит, да, всегда возможно, что проблема в неисправном оборудовании — изношенная проводка или перегоревший динамик, — но чаще всего проблема может быть решена человеком, который говорит в микрофон. Он или она должны знать свой собственный голос; как использовать и направить его так, чтобы слушатель мог понимать звуки «отсюда туда».
Техническая сторона
На самом деле, мы не будем вдаваться в технические подробности, потому что, если вы не инженер или специалист по физике, «отсюда туда» может быть довольно сложно. Но все начинается с микрофона.
Микрофон (также называемый «микрофон» или «микрофон») поглощает акустический звук, который затем преобразуется в электрический сигнал.
Типы микрофонов различаются для использования в телефонах, радиоприемниках, слуховых аппаратах, магнитофонах, живых выступлениях (музыкальных, театральных и т. Д.), Студиях звукозаписи и т. Д.
Популярные микрофоны
- Конденсаторные микрофоны: Внутри конденсаторного микрофона тонкие металлические пластины работают против неподвижных пластин при приложении звукового давления. Их внутренняя работа очень тонкая; изменения температуры (которые вызывают конденсацию) могут вызвать «шипящий» звук. Конденсаторные микрофоны имеют динамический диапазон, широкую частоту и очень чувствительны к звуку — они обычно считаются лучшим вариантом для студийных записей (хотя и не обязательно для живых выступлений). Конденсаторные микрофоны могут быть отдельно стоящими, но они также могут быть встроены в телефоны, караоке, магнитофоны и цифровые записывающие устройства, видеокамеры и компьютеры.
- Динамические микрофоны: Внутри динамического микрофона коническая структура «втягивает» звук; это давление перемещает прикрепленные к конусу катушки в магнитном поле. С процессом под названием eлектромагнитная индукция, динамический микрофон работает как стерео или громкоговоритель системы громкой связи, но в обратном направлении; звуки перемещают катушку, которая генерирует напряжение. Громкоговоритель работает наоборот; его электрический ток гонит звук наружу. Динамические микрофоны из-за их низкой выходной мощности и высокочастотной характеристики обычно не используются для большинства записей и не встроены непосредственно в компьютерные и видеосистемы. Эти микрофоны бывают разных размеров и чаще всего используются для живых выступлений.
- Ленточные микрофоны: Внутри ленточного микрофона тонкая металлическая полоска подвешена в магнитном поле. Лента подключается к выходу микрофона, который вибрирует, генерируя электрический сигнал. Полоса имеет тенденцию создавать более толстые звуковые тона, поскольку она акцентирует низкие частоты. Ленточные микрофоны хрупкие и чаще всего используются с системами громкой связи.
Краткий обзор других микрофонов
- Углеродные микрофоны иметь некачественный звук с ограниченным частотным диапазоном; когда-то они обычно использовались для телефонов.
- Кристальные микрофоны использовать процесс, называемый пьезоэлектрическим давлением; он индуцирует напряжение для преобразования вибрации в электрические сигналы. Пьезо (кристаллические) электрические микрофоны могут использоваться для усиления акустических музыкальных инструментов в дополнение к записи звука в определенных условиях.
- Лазерные микрофоны улавливать сигналы, производимые вибрирующими звуками. Петличные микрофоны — это крошечные устройства, которые крепятся к предметам одежды.
- Беспроводные микрофоны используются в живых музыкальных выступлениях, но также и с системами оповещения. Без подключенных шнуров пользователи беспроводных микрофонов могут свободно перемещаться в пределах частотного диапазона устройства.
- Микрофоны гарнитуры, такие как те, которые часто используются в ресторанах быстрого питания и call-центрах, очень чувствительны. Они сидят близко ко рту пользователя и, таким образом, улавливают внешний фоновый шум.
Важность проверки звука
Во время презентации звук — это все! Поскольку размеры комнат и их акустические свойства различаются, проверка звука очень важна. Если аудиотехник находится у деки системы громкой связи до и во время вашей презентации, он или она отрегулирует настройки микрофона и громкоговорителей, чтобы определить правильный баланс между вами и аудиторией. Однако, если техник устанавливает систему, но не может проверить звук или запустить доску во время презентации, вы можете проверить уровни звука в разных частях комнаты, попросив кого-нибудь «быть аудиторией». Их ввод поможет вам определить, насколько хорошо звук распространяется и слышен из самой дальней точки комнаты.
Вокальная сторона
Микрофоны усиливают ваш голос, но, если вы не говорите в них должным образом, они не сделают звук, идущий через динамики, чистым или приятным для прослушивания. Говорите в микрофон своим «радио-голосом».
Подождите, у вас нет «радио-голоса»?
Да, это так, но вы должны научиться им пользоваться. Использование вашего «радио-голоса» может быть очень похоже на ваш повседневный голос, но для этого нужно немного подумать и немного попрактиковаться.
- Репетируйте то, что вы собираетесь сказать. По возможности избегайте сценария «невнятного», когда вы бормочете фразы и предложения, не задумываясь о них заранее. Либо запишите слова (чтобы читать их, как если бы вы читали сценарий), либо сформулируйте их в уме, прежде чем говорить. Независимо от того, оставляете ли вы сообщение на автоответчике или обращаетесь к группе людей, всегда полезно знать, что вы собираетесь сказать, прежде чем сказать это. . . не важно как ты скажи.
- Согрейте свой голос немного, чтобы избежать того рыхлого искаженного звука, который исходит из тишины. Смочите горло теплой водой — другие напитки, которые часто употребляются как профессионалами, так и любителями, не рекомендуются из-за повреждения микрофона.
- Встаньте (или сядьте) прямо. Ваше тело — это структура, ваш голос — это инструмент! Позвольте воздуху проходить, пока вы дышите. Если вы сидите — не сутулитесь и не позволяйте грудной клетке упасть на живот. Если вы стоите на трибуне или на сцене, найдите удобное место, которое позволит вам говорить в микрофон, но не прямо в него. Слишком сильное вращение приведет к искажению звука.
- Убедитесь, что микрофон включен. У некоторых микрофонов есть переключатели «вкл.-Выкл.» Прямо под головой, а у некоторых их нет (они полностью контролируются декой). Знайте, когда микрофон «горячий» (включен с увеличенной громкостью), а когда выключен. Смотрите, что вы говорите; горячий микрофон может привести к неприятным моментам!
- Расположите микрофон на расстоянии пары дюймов ото рта. Не «глотайте» микрофон! Если ваш рот находится прямо над микрофоном, он будет издавать искаженный звук и улавливать каждое шипение, вдох, хлопок и потрескивание. Помимо искажений и шумов, слишком тесный разговор в микрофонную головку может вызвать громкий визг или обратную связь. (Ветровое стекло может помочь уменьшить или устранить фоновый шум при использовании микрофонов на улице). Помните, ваш голос должен течь через микрофон, а не прямо в него.
Если вы используете петличный микрофон, прикрепите его примерно на восемь дюймов ниже подбородка к лацкану, галстуку или любому предмету свободной одежды, который плотно прилегает. Микрофоны «Lav» могут быть проводными или беспроводными; комплект передатчика беспроводного микрофона должен быть прикреплен к телу. Будьте осторожны с украшениями, одеждой и волосами — микрофон может улавливать дребезжание и шорох.
Доставка — это все
Говорить! Громко, четко и медленно. Обязательно озвучивайте свои слова. Высота, громкость, ритм, интонация и скорость — все это часть публичных выступлений, поэтому прислушивайтесь к тонкому голосу в своей голове, пока вы произносите слова. Что ты слышишь? Это «LALALALALAlalalalalaBZZZZBZZshshshshsWaaWaaWaaWaa?» Или вы слышите каждое слово, сказанное четко и ясно?
Советы о том, как говорить в микрофон
- Подготовить: Приготовьтесь подойти к микрофону, произносите ли вы речь по сценарию или просто говорите несколько слов. Подумайте, что вы собираетесь сказать. Помните, что то, что вы слышите в своей голове, отличается от того, что может слышать ваша аудитория.
- Упражняться: Практикуйте свою речь и репетируйте ее интонации, ритм и доставку. Знайте свой материал.
- Слушать: Слушайте голос в своей голове — он может сказать вам, когда вы говорите слишком быстро или слишком медленно. Этот голос может помочь вам решить, звучит ваша презентация интересно или скучно. Ваш вокальный тон слишком высок? Слишком низко? Слишком однообразно? Слишком много перегибов или недостаточно? Слушайте других, кто говорит в микрофон; ты понимаешь слова? Эти люди говорят слишком быстро или слишком медленно? Передают ли они информацию ясно и кратко? Также послушайте радио; диктор говорит медленно и лаконично? Вы отчетливо слышите текст? Хотя это правда, что некоторые дикторы на радио лучше, чем другие, все они говорят с аудиторией. Дикторы знать кто-то слушает. Не забывайте, что когда вы говорите, люди тоже вас слушают.
- Говорить: Говорите и читайте вслух. Читайте газету вслух, как будто вы передаете новости по радио. Говорите в цифровой диктофон, а затем слушайте то, что вы записали. На что это похоже? Вы все прекрасно понимаете? Вас интересует, что говорит (вы) говорящий? Кстати, радиоведущие и диск-жокеи часто записывают, а затем слушают свои вокальные выступления; воздушная проверка является частью торговли.
- Учить: Изучите искусство речи, общения и публичных выступлений. Ваша местная библиотека, школьный округ или местный колледж могут предлагать программы повышения квалификации.
Мой профессиональный опыт работы с микрофонами
Я ведущий новостей и ведущий программ по профессии, много лет работаю в эфире различных радиостанций. Я также мощный вокалист полного диапазона с большим опытом записи на сцене и в студии. Хотя я не техно-гик, я люблю звук!
Нет, я не идеален. Есть несколько слов, которые я (стараюсь) никогда не использовать в тексте вещания, потому что даже после всех этих лет мне все еще трудно их произносить. И мне действительно трудно понять некоторые акценты. . . это тоже уходит много лет назад.
Но да, у меня есть несколько неприятных моментов. (Например, когда «полоса», «ручей», «клубника» и «прямой» произносятся как «штрайп», «штрим», «клубничный» и «штрейт». Такое случается часто (может быть, это грязная вещь), но особенно неприятно и неприятно слышать, как телеведущие и профессиональные ораторы включают звук s-t-r. — на любых словах, в которых используются эти буквы в указанном порядке — в ш-т-р.)
Однако одна большая проблема заключается в том, чтобы прислушиваться к голосам (некоторых) людей в системы громкой связи; они болтают или разговаривают очень тихо. Они жуют жвачку или еду. Они говорят в их аудитория вместо к их аудитория. И публика. . . состоит из реальных людей. . . теряет интерес. Я вижу людей вокруг себя — им скучно, они отвлечены и не интересуются произнесенными словами.
Плохая связь и плохой звук равносильны потерянному сообщению. Как бы просто это ни звучало, поэтому так важно уметь говорить в микрофон,
Помнить…
То, что вы говорите, может быть не так, как слушатели, поэтому. . . установите зрительный контакт и говорите четко, громко, медленно, сжато и ритмично. Не слишком быстро и не слишком медленно. Не загоняйте микрофон, прикладывая к нему рот; говорить по верху. Репетируйте то, что вы собираетесь сказать, прочистите и увлажните горло, убедитесь, что микрофон включен, и не произносите слова невнятно. Обратите внимание на окружающий шум, который может проникать в микрофон; устраните близлежащие отвлекающие факторы.
Голосовой ввод текста: топ-5 бесплатных инструментов
Если вы работаете в digital-маркетинге, вам постоянно нужно взаимодействовать с текстом: записывать идеи, задачи, описывать концепции, писать статьи и многое другое. Иногда проще и быстрее надиктовать текст, чтобы не забыть важную мысль или задачу. Диктофон для этого подходит плохо: запись потом нужно будет расшифровывать и переводить в текст. А если оставлять голосовые заметки часто, то потом просто нереально быстро найти нужную информацию или бегло ее просмотреть.
Голосовой ввод текста помогает решить эту проблему. Вы диктуете — программа сразу переводит речь в текст, который вы можете сохранить как обычную заметку и дальше работать с ней спокойно работать.
В статье мы собрали подборку бесплатных сервисов голосового ввода, которые помогут вам:
- быстро и удобно делать заметки, когда нет возможности или времени записывать вручную;
- записывать голосом список задач;
- надиктовывать черновики статей и других текстов.
Берите на вооружение сервисы из подборки и тестируйте — все они бесплатные и неплохо распознают русский язык.
5 бесплатных онлайн-сервисов для голосового ввода
1. SpeechPad
Speechpad — бесплатный сервис для голосового ввода текста. Доступен в трех форматах:
- онлайн-сервис;
- браузерное расширение — с его помощью можно вводить текст в любое поле для ввода;
- мобильное приложение для Android и iOS.
У сервиса также есть платные функции. Их два вида:
- дополнительные (расширенные). Включают в себя голосовой ввод в режиме интеграции с OS Linux и Windows, а также транскрибирование аудиофайлов длиной более 15 минут;
- премиум. Пакетное транскрибирование аудио и видео (больше двух файлов).
Онлайн-сервис
Интерфейс сервиса выглядит так:
Здесь есть несколько настроек, кнопки управления и поле, в котором отображается распознаваемый текст.
Что можно сделать сделать:
- настроить язык голосового ввода. Базово с списке доступно 14 языков (среди них русский, украинский, английский, немецкий). Если нужен другой язык, необходимо зарегистрироваться в сервисе. После этого в личном кабинете появится возможность добавить этот язык (если для него поддерживается распознавание речи);
- активировать опцию «Включить команды». Если вы авторизованы в личном кабинете, вы можете добавлять голосовые команды и использовать их при надиктовке текста. Например, удалить последний распознанный фрагмент текста;
- отключить управление заглавными буквами Google. По умолчанию в речи распознается начало предложений и автоматически проставляются заглавные буквы. Вы можете отключить эту опцию и самостоятельно редактировать предложения.
Обратите внимание! Онлайн-сервис Speechpad корректно работает только в браузере Google Chrome. Можно запускать его и в Яндекс.Браузере, но все же для корректной работы рекомендуется использовать именно Chrome.
Для начала распознавания текста нажмите кнопку «Включить запись» и предоставьте доступ к микрофону.
Затем надиктовывайте текст. Сначала распознанные слова появятся в поле справа от кнопки «Включить запись». После небольшой паузы они попадут в поле ниже (результирующее поле).
Над результирующем полем есть кнопки со знаками пунктуации. По ходу диктовки вы можете добавлять их вручную.
После того как вы закончили диктовку, просмотрите текст, исправьте ошибки (если есть). Затем скопируйте текст или скачайте в виде txt-файла.
Транскрибация
Также с помощью Speechpad можно переводить аудиозаписи разговоров в текст с помощью опции «Транскрибация».
Здесь можно будет загрузить аудио- или видеофайл, а также добавить ссылку на видео с Youtube.
После нажатия на кнопку «Включить запись» файл начнет проигрываться и система переведет речь в текст.
Расширение SpeechPad
Установите расширение из магазина расширений Google Chrome. После установки в контекстном меню в браузере (при клике правой кнопкой мыши на любой области экрана) появится пункт «SpeechPad».
Кликните правой кнопкой мыши по любому полю для ввода текста и выберите расширение из контекстного меню. Поле подсветится, и вы сможете голосом произнести фразу, которую нужно ввести в поле. Расширение распознает ее и отобразит в виде текста.
Мобильное приложение
Доступно две версии: для Android и iOS.
Приложение может работать в автономном режиме (без подключения к интернету). Так выглядит интерфейс приложения на Android:
В настройках можно управлять голосовыми командами (для расстановки знаков препинания и спецсимволов с помощью голоса):
2. VoiceNote
VoiceNote — еще один сервис для преобразования голоса в текст, который работает только в Google Chrome (также может работать в Яндекс.Браузере). При попытке запустить его в другом браузере появляется сообщение об ошибке.
Для голосового ввода через VoiceNote можно использовать Live Demo или отдельное приложение для Chrome.
Как пользоваться сервисом
Откройте редактор и выберите язык, на котором нужно распознавать речь. Для этого кликните по иконке земного шара и укажите нужный язык.
Затем кликните по значку микрофона и предоставьте сервису доступ к микрофону вашего компьютера или ноутбука.
После этого система начнет запись и вы сможете надиктовывать текст. Распознанный текст появится в редакторе. Возможности:
- можно проговаривать знаки препинания словами;
- голосовой командой можно перевести текст на новую строчку;
- с помощью панели инструментов можно вручную добавлять знаки препинания и спецсимволы прямо во время диктовки;
- готовый текст можно отредактировать и сохранить в txt-файле.
3. Voice Notepad
Еще один сервис для голосового ввода текста. Как и остальные сервисы, работает только в браузере Google Chrome.
У сервиса простой интерфейс. Здесь есть:
- возможность выбрать язык распознавания (сервис работает на основе движка Google Speech Recognition и может распознавать речь на более чем 100 языках);
- текстовое поле — здесь будет появляться распознанный текст, который можно отформатировать: выделить полужирным, курсивом или подчеркиванием, оформить списки, добавить или убрать отступы, задать выравнивание;
- кнопки управления — кнопка Start активирует распознавание речи. С помощью остальных кнопок можно копировать текст, сохранять в txt-файл, публиковать и совершать другие действия.
Сервис поддерживает голосовые команды. Например, с помощью команды можно перевести текст на новую строку, поставить тире или другие знаки препинания, спецсимволы и т. д.
Полный список поддерживаемых команд для русского языка — здесь.
4. Speechtexter.com
Бесплатный онлайн-сервис для распознавания речи. Достаточно неплохо распознает русский язык. Всего поддерживает более 60 языков.
У SpeechTexter есть веб-версия (работает только в Google Chrome) и мобильное приложение для Android.
Для начала работы с сервисом необходимо выбрать язык распознавания и нажать кнопку Start (предоставив доступ к микрофону).
В текстовом поле есть несколько полезных функций:
- счетчик слов, распознанных системой;
- инструменты редактирования текста: выделение полужирным, курсивом, подчеркиванием, выравнивание текста, изменение размера шрифта. Также можно менять цвет текста, создавать нумерованные и ненумерованные списки;
- можно включить ночной режим — полезно, если вы используете сервис вечером или ночью.
В правой части интерфейса размещен блок со стандартными голосовыми командами для добавления знаков препинания и нового абзаца:
На вкладке Custom можно создать свои команды, например для добавления кавычек.
После завершения диктовки текст можно отредактировать и сохранить в файле:
- в txt-файле;
- документом Microsoft Word.
5. TalkTyper
Простой онлайн-сервис для голосового ввода с поддержкой 37 языков.
В этом сервисе минимум функций, однако с распознаванием русского языка он справляется вполне неплохо. Для начала распознавания речи необходимо нажать на значок микрофона, разрешить его использование в браузере и начать диктовку текста.
Если сервис распознал фразу неправильно, нажмите на значок «Варианты»:
Если среди предложенных вариантов нет правильного, текст можно поправить вручную.
После завершения распознавания вы можете сохранить текст в txt-файле, скопировать, распечатать или отправить на почту.
Дополнительные инструменты для голосового ввода текста
Яндекс.Клавиатура и GBoard (Google Клавиатура)
Если вы большую часть времени работаете со смартфона и хотите использовать возможность голосового ввода текста, воспользуйтесь функционалом голосового ввода, который есть в клавиатурах от Google и Яндекс:
- GBoard — клавиатура от Google. Для Android и iOS;
- Яндекс.Клавиатура. Для Android и iOS.
Так вы сможете надиктовывать текст в любом приложении, которое вы обычно используете для организации личных и рабочих заметок, задач и подобного (Google Keep, Notion, Trello и т. д.).
Воспользоваться голосовым вводом просто:
- Откройте нужное приложение (например, Google Keep) и создайте заметку;
- Откройте клавиатуру и нажмите на значок микрофона (ниже пример, как это сделать в GBoard);
- Начните диктовать заметку. Система распознает речь и преобразует ее в текст.
Голосовой ввод на GBoard (клавиатуре от Google)
Google Docs
Тем, кто много работает с Google Документами, пригодится встроенная функция голосового ввода (поддерживает русский язык).
Если вы еще не знали о ней, вот как ее включить: «Инструменты» → «Голосовой ввод».
Слева появится всплывающее окошко с выпадающим списком для выбора языка речи и кнопкой с иконкой микрофона.
Выберите нужный язык, нажмите на кнопку и начните диктовать текст.
Рекомендации, которые помогут улучшить качество распознавания текста
Все сервисы, которые мы привели в подборке, достаточно хорошо распознают русский язык, однако иногда качество распознанного текста может быть посредственным. Чтобы такого не происходило, следуйте нескольким базовым рекомендациям.
Телефонный прикол для людей с компутерами и микрофоном Суть прикола такова: говорим что-нибудь в микрофон.
Телефонный прикол для людей с компутерами и микрофоном. Суть прикола такова: говорим что-нибудь в микрофон во время записи, кто что хочет.
Записали? Молодцы! Так, теперь берём и замедляем/убыстряем речь — главное, что бы все слова были четко слышны, а что делать дальше дело фантазии.
Похожие анекдоты
Особенно трудно искать работу, когда работать не хочется!
Не хочешь эту мелодию на свой мобильный телефон?! Отправь «НЕ ХОЧУ»на 4242!
Из безвыходного положения выход находится там же, где вход.
Эстонцы очень любят приходить в Таллиннский зоопарк и наблюдать, как на деревьях резвятся ленивцы.
Березовский нашел письмо, в котором Пиночет обвиняет в своей смерти ФСБ и лично Путина.