Создаем Telegram-бота: Аудио в текст с n8n и OpenAI

Суть за 30 секунд

Видео-инструкция по созданию Telegram-бота для автоматической транскрибации голосовых сообщений. В качестве “движка” автоматизации используется n8n, а для преобразования аудио в текст — API OpenAI (Whisper). Весь процесс от настройки триггера до отправки результата пользователю занимает около 10 минут и не требует написания кода.

📍 Навигация (Timeline)

  • 00:00Введение: Концепция workflow в n8n как последовательности действий.
  • 00:58Основы workflow: Трансформация входных данных (аудио) в выходные (текст).
  • 02:49Telegram Trigger: Настройка первого шага для приема входящих сообщений.
  • 03:45BotFather: Получение Access Token и создание нового бота в Telegram.
  • 06:16Тестирование: Проверка правильности настройки токена через команду /start.
  • 08:46Анализ данных: Разбор структуры входящего JSON-сообщения с аудио-параметрами.
  • 10:09Get a File: Скачивание аудиофайла с серверов Telegram по его file_id.
  • 13:08OpenAI Integration: Настройка шага Transcribe Recording для преобразования речи в текст.
  • 14:36Send Message: Настройка финального шага для отправки транскрибированного текста.
  • 15:34Chat ID: Динамическая привязка ответа к отправителю через переменные.
  • 16:53Заключение: Итоговая демонстрация работы бота.

🧠 Ключевые концепции (Wiki-связи)

  • Инструменты: n8n, Telegram Bot API, OpenAI.
  • Методы: Workflow Automation, Speech-to-Text, API Integration.
  • Технологии: Whisper API, Webhooks.

🛠 Практические фишки

  • Используйте BotFather: Это единственный официальный способ получить токен для управления вашим ботом.
  • Проверка JSON-структуры: Всегда делайте пробный запуск шага (Execute Step), чтобы увидеть реальную структуру данных и правильно связать file_id.
  • Динамический Chat ID: Никогда не прописывайте ID вручную. Берите его из входящего сообщения триггера, чтобы бот мог отвечать любому пользователю.
  • Обработка ошибок: Для продакшн-решений добавьте проверку на наличие аудиофайла в сообщении, чтобы workflow не падал на текстовых запросах.

📌 Резюме

Связка n8n и OpenAI позволяет за считанные минуты автоматизировать рутинную задачу перевода голосовых сообщений в текст. Это отличный пример того, как No-code инструменты могут решать реальные задачи продуктивности, объединяя мощные API в единый работающий процесс.