Создаем Telegram-бота: Аудио в текст с n8n и OpenAI
Суть за 30 секунд
Видео-инструкция по созданию Telegram-бота для автоматической транскрибации голосовых сообщений. В качестве “движка” автоматизации используется n8n, а для преобразования аудио в текст — API OpenAI (Whisper). Весь процесс от настройки триггера до отправки результата пользователю занимает около 10 минут и не требует написания кода.
📍 Навигация (Timeline)
- 00:00 — Введение: Концепция workflow в n8n как последовательности действий.
- 00:58 — Основы workflow: Трансформация входных данных (аудио) в выходные (текст).
- 02:49 — Telegram Trigger: Настройка первого шага для приема входящих сообщений.
- 03:45 — BotFather: Получение Access Token и создание нового бота в Telegram.
- 06:16 — Тестирование: Проверка правильности настройки токена через команду
/start. - 08:46 — Анализ данных: Разбор структуры входящего JSON-сообщения с аудио-параметрами.
- 10:09 — Get a File: Скачивание аудиофайла с серверов Telegram по его
file_id. - 13:08 — OpenAI Integration: Настройка шага Transcribe Recording для преобразования речи в текст.
- 14:36 — Send Message: Настройка финального шага для отправки транскрибированного текста.
- 15:34 — Chat ID: Динамическая привязка ответа к отправителю через переменные.
- 16:53 — Заключение: Итоговая демонстрация работы бота.
🧠 Ключевые концепции (Wiki-связи)
- Инструменты: n8n, Telegram Bot API, OpenAI.
- Методы: Workflow Automation, Speech-to-Text, API Integration.
- Технологии: Whisper API, Webhooks.
🛠 Практические фишки
- Используйте BotFather: Это единственный официальный способ получить токен для управления вашим ботом.
- Проверка JSON-структуры: Всегда делайте пробный запуск шага (Execute Step), чтобы увидеть реальную структуру данных и правильно связать
file_id. - Динамический Chat ID: Никогда не прописывайте ID вручную. Берите его из входящего сообщения триггера, чтобы бот мог отвечать любому пользователю.
- Обработка ошибок: Для продакшн-решений добавьте проверку на наличие аудиофайла в сообщении, чтобы workflow не падал на текстовых запросах.
📌 Резюме
Связка n8n и OpenAI позволяет за считанные минуты автоматизировать рутинную задачу перевода голосовых сообщений в текст. Это отличный пример того, как No-code инструменты могут решать реальные задачи продуктивности, объединяя мощные API в единый работающий процесс.