6 инструментов для голосового ввода текста онлайн и офлайн
Содержание:
- Word стал умнее
- Развитие имеющихся возможностей
- При помощи Speachpad можно пользоваться голосовым вводом текста для Word
- Чему научился Word
- Расширение для Microsoft Word поможет записать голосом
- Без ограничений не обошлось
- Как включить голосовой ввод в Гугл Документах
- Ввод текста голосом при помощи Google Drive
Word стал умнее
Корпорация Microsoft интегрировала в текстовый редактор Word функцию «расшифровки» (транскрибирования) аудиозаписей – Transcribe. Приложение научилось переводить записи диалогов в текст с возможностью его последующего редактирования. Над нововведением специалисты Microsoft работали несколько лет – впервые оно было анонсировано еще в 2019 г., но в доступную обычным потребителям версию Word ее добавили только сейчас.
Для запуска функции необходимо нажать кнопку «Диктовать» (Dictate) в строке меню, а затем в выпадающем списке нужно выбрать пункт «Транскрибировать» (Transcribe).
На момент публикации материала нововведение было доступно в веб-версии Word для пользователей сервиса Microsoft 365 (раньше он назывался Office 365). Microsoft реализовала поддержку только английского языка, но это ограничение временное – специалисты работают над внедрением других языков, хотя и не раскрывают конкретные сроки. Также до конца 2020 г. Transcribe появится в мобильной версии Word.
Развитие имеющихся возможностей
Инструмент Transcribe стал дополнением к функции Dictate, которую можно обнаружить в том же выпадающем списке. Она была добавлена в состав Microsoft 365 еще в июне 2017 г. и была создана в рамках экспериментальной программы Microsoft Garage, поощряющей сотрудников Microsoft работать над проектами, которые им интересны, даже если они не связаны с их основной деятельностью.
Название Dictate полностью отражает суть функции – с ее помощью пользователь может надиктовывать записи в Word, а также в OneNote, PowerPoint и Outlook. После диктовки речь транскрибируется в текст, который в дальнейшем можно редактировать. На момент запуска Dictate, в отличие от Transcribe, поддерживал 20 наиболее распространенных языков и имел возможность перевода текста на 60 языков, притом в реальном времени.
При помощи Speachpad можно пользоваться голосовым вводом текста для Word
Расширение доступно в магазине Chrome по адресу https://chrome.google.com/webstore/detail/online-speech-recognition/pehlbpmpoabkgenppepoaihkacolpdcf?hl=ru.
Порядок действий:
- Войдите с Google Chrome и нажмите кнопку «Установить»;
- После этого нажмите на панели вверху справа значок и укажите в окне язык ввода и другие настройки;Настройки расширения Speachpad
- Теперь перейдите на сайт, где нужно использовать голосовой ввод, и нажмите на окне для печати правую кнопку мыши. Появится небольшое контекстное окошко, где нужно выбрать расширение. После этого вы сможете озвучивать ваши предложения;Активация Speachpad в браузере Google Chrome
- Можно воспользоваться любым редактором текста онлайн временно, чтобы после чтения скопировать и вставить результат в Word.
Вы сможете настроить горячие клавиши для запуска Speachpad. Расширение работает также в браузере Google Chrome для Linux. Здесь доступны настройки регистра первой буквы. Если вы установите флажок на пункте «Заменять слова пунктуации», то сможете ставить знаки препинания голосом. То есть, если вы произнесете «запятая», расширение поставит её. Даже если явно выключить такую функцию, то Google может заменять самостоятельно такие слова.
Активировав настройку расширения «Выполнять команды», вы сможете диктовать поведение редактора во время ввода (перенос строк и т. д.). Функция «Вывод в буфер» позволяет вам сразу копировать надиктованный результат в буфер. При этом в поле для ввода текст появляться не будет. После каждого предложения или абзаца можно сразу же нажимать CTRL+V в редакторе. После чего снова нажимать на открытую вкладку Chrome и диктовать новое предложение. Эта функция также полезна на сервисах, которые не позволяют вводить текст таким способом.
Чему научился Word
Word умеет преобразовывать речь в текст «на лету» – для этого в нем предусмотрена возможность записи разговора. Также можно загружать в него уже готовые записи, но пока только в форматах wav, mp3, m4a и mp4. В этом случае на преобразование может потребоваться несколько минут, в зависимости от размера загружаемого файла и длительности самой беседы.
С новой функцией Word больше не нужно использовать сторонние приложения для распознавания речи
Функция распознавания текста Transcribe основана на облачных технологиях Microsoft и использует алгоритмы искусственного интеллекта. Результат ее деятельности можно сохранять в отдельном документе Word или копировать в уже имеющиеся. Также система умеет распознавать голоса нескольких собеседников и помечать их, но пока это работает только для двух человек.
Итоговый текст диалога может содержать ошибки, и Word позволяет устранить их вручную. Например, если кликнуть на ту или иную часть текста, приложение автоматически воспроизведет соответствующий фрагмент записи, притом сможет сделать это с замедленной скоростью.
Microsoft постаралась максимально упростить работу с инструментом транскрибирования
Использовать новую «фишку» Microsoft можно будет, к примеру, если потребуется вставить текст точную цитату из интервью, записанного на диктофон. Также она может упростить процесс дословной записи речи или, к примеру, лекции в вузе.
Расширение для Microsoft Word поможет записать голосом
В сети по адресу https://dictate.ms/ есть специальное дополнение. Программа предназначена для голосовой печати в Ворде. После установки на панели инструментов документа появится новая вкладка «Dictation». Выбрав её, в окне появится кнопка с микрофоном. Она предназначена для старта записи. В этом же окне доступен выбор одного из 20 языков, на котором нужно вводить предложения озвучкой.
Расширение Dictation во вкладке документа Word
Это дополнение доступно для многих версий текстового редактора, так как является разработкой компании Microsoft. Её можно применять не только в Word, но и в PowerPoint, и Outlook
Стоит обратить внимание на то, какой пакет нужен для вашей системы Windows. Разрядность можно посмотреть в системном окне, нажав WIN+PAUSE
Этот параметр будет указан в строке «Тип системы». Dictate устанавливается как и любая другая программа. Но по её завершению нуждается в активации. Это можно сделать в настройках.
Работа расширения для перевода голоса в текст основана на нескольких компонентах — Cortana (доступна в Windows 10) и местном переводчике Microsoft Translator. Для стабильной работы требуется компонент .NET Framework 4.5.0.
Без ограничений не обошлось
Пример работы Word Transcribe
Однако самое серьезное ограничение связано с длительностью распознаваемых диалогов, что пока исключает Transcribe из списка инструментов тех, кто профессионально занимается переводом (транскрибирования) аудиозаписей разговоров в текст. Word может расшифровать не более пяти (5) часов диалогов, притом в месяц.
Как перевести четверть клиентов на самообслуживание? Опыт банка «Открытие»
ИТ в банках
Обойти это ограничение пока никак нельзя. Даже нет возможности купить дополнительные часы за деньги, как и научить Word работать с файлами весом свыше 200 МБ.
Как включить голосовой ввод в Гугл Документах
Рис. 3. Включаем голосовой ввод в Гугл Документах.
В Документах кликаем по вкладке «Инструменты» (1 на рис. 3), а в появившемся меню выбираем опцию «Голосовой ввод». Вместо этих двух кликов можно нажать на горячие клавиши Ctrl+Shift+S.
Далее может появиться маленькое окно по поводу вашего согласия на использование микрофона. По крайней мере, так бывает при первом использовании голосового ввода в Документах. Конечно, нужно согласиться и для этого кликнуть по кнопке «Разрешить» доступ к микрофону. Иначе будет невозможно оцифровать свою речь в текст.
После согласия на использование микрофона появится значок микрофона (рис. 4). Теперь можно, наконец, приступить к голосовому вводу.
Рис. 4. Нажав кнопку микрофона, можно говорить в Гугл Документах.
Небольшое напутствие перед тем, как начать свою речь
Чтобы текст получился корректным, нужно добавить в него точки в конце каждого предложения. Кроме того, весьма желательно, чтобы были абзацы.
Если просто говорить текст, то там автоматически, сами по себе не появятся точки и абзацы. Поэтому в речи следует произносить команды: говорить «точка» в конце каждого предложения и произносить «новая строка» в том случае, когда понадобится начать новый абзац.
Возможно, такие команды кому-то покажутся утомительными. Можно их не произносить, но тогда потребуется потратить некоторое время на ручную обработку текста. Понадобится вставить точки, заглавные буквы в начале каждого предложения и разбить текст на абзацы.
Рис. 5. Команды: Точка и Новая строка при голосовом вводе в Гугл Документах.
Ручная коррекция текста может понадобиться в любом случае. Здесь многое зависит от «сноровки» пользователя, четкой дикции и некоторого опыта работы с голосовым вводом.
Для записи речи следует нажать на серенький значок микрофона, он показан на рисунках 4 и 5. После этого значок станет красным (рис. 6). Это означает, что микрофон включен, идет запись, можно говорить и одновременно смотреть на экране, как идет запись текста.
Рис. 6. Микрофон включен, он стал красным. Можно говорить, идет запись речи.
По цвету значка микрофона легко определить, идет запись или нет. Серый значок означает, что запись речи не происходит, а значит, нет смысла говорить в микрофон.
Красный значок сигнализирует о том, что идет запись речи. Следовательно, можно говорить в микрофон, и одновременно будет появляться текст в Документах.
Рис. 7. Микрофон выключен, он серый. Это значит, что запись временно приостановлена или завершена.
Как отключить голосовой ввод в Гугл Документах
Если пользователь закончил запись свой речи, то для отключения голосового ввода нужно нажать на красный значок микрофона (рис. 6), который сразу же сменит свой цвет на серый, микрофон отключится, и речь перестанет записываться.
Также можно закрыть Гугл Документ. Тогда будет отключен не только голосовой ввод, но будет закрыт файл, куда шла запись речи, а также закроется приложение Документы. Можно не беспокоиться про сохранение файла. Известно, что в Гугл Документах происходит автоматическое сохранение всех изменений файла.
Если не нужен Google Chrome, то можно его закрыть. Закроется браузер, Гугл Документы и прекратится запись речи.
Имеется также возможность выключить микрофон в своем устройстве. Для этого имеются встроенные системные средства. Но, на мой взгляд, такой вариант является крайней мерой. Ибо если выключить микрофон, то потом при необходимости понадобится снова включать его. Думаю, что для многих пользователей это неподходящий способ для того, чтобы отключить голосовой ввод.
Ввод текста голосом при помощи Google Drive
Наверное, самым подходящим способом печатать текст, продиктовав его в микрофон, является использование Гугл диска. Многие пользователи обзавелись аккаунтами в этой известной платформе. И каждый сможет воспользоваться его основной функцией — Google Docs. Именно этот онлайн-редактор имеет нужную нам функцию.
Для тех, кто не знает, что имеет в своем аккаунте Google дополнительные возможности:
- Авторизуйтесь в системе https://google.com/ или зарегистрируйте новый аккаунт;
- Перейдите на главную поисковика (то есть по уже указанному адресу) и выберите вверху «Приложения Google» (кнопка из 9 квадратов);Дополнительные приложения Google
- Найдите и выберите в списке Google Drive;
- Затем нажмите на большую кнопку слева «Создать»;
- Выберите в контекстном меню пункт «Google документы»;Создание Google документа в Google Docs
- Откроется окно текстового редактора. Вам нужно выбрать вверху кнопку «Инструменты» и пункт «Голосовой ввод»;Выбор голосового ввода во вкладке «Инструменты» Google Docs
- Для того, чтобы активировать эту возможность, у вас должен быть подключен к компьютеру и настроен микрофон. В противном случае строка будет неактивной;
- Попробуйте говорить, чтобы увидеть отображаемый текст в окне.
Этот текст можно скопировать и вставить в документ Word. Когда предложения будут надиктованы и отредактированы, нажмите вместе на клавиатуре CTRL+A. После этого откройте пустой файл Ворд и нажмите в нём CTRL+V. Сохраните документ.