edge-tts: Công Cụ Text-to-Speech Miễn Phí, Đọc Tiếng Việt Cực Mượt, Không Cần API Key

Bạn đang cần voice-over cho video nhưng không muốn tự đọc, không có tiền thuê người, và chán ngấy mấy giọng robot của Google TTS? Có một giải pháp Python chỉ cần 1 dòng cài đặt mà nhiều người chưa biết đến: edge-tts.


edge-tts Là Gì?

edge-tts là thư viện Python mã nguồn mở, cho phép bạn sử dụng dịch vụ Text-to-Speech của Microsoft Edge (chính là giọng “Read Aloud” trong trình duyệt Edge) ngay từ dòng lệnh hoặc code Python — không cần trình duyệt Edge, không cần Windows, không cần API key, không cần đăng ký tài khoản .

📦 Repo: github.com/rany2/edge-tts — 10.000+ GitHub stars, 40.000+ lượt tải mỗi tuần trên PyPI .


Cài Đặt

bashpip install edge-tts

Hoặc nếu chỉ dùng qua command line:

bashpipx install edge-tts

Chỉ vậy thôi. Không cần cấu hình environment, không cần tạo project Azure, không cần nhập credit card .


Cách Sử Dụng

▶ Cách 1: Command Line — Nhanh Nhất

bashedge-tts --text "Xin chào các bạn!" \
  --voice vi-VN-HoaiMyNeural \
  --write-media output.mp3 \
  --write-subtitles output.srt

2 giọng tiếng Việt để chọn :

  • vi-VN-HoaiMyNeural — giọng nữ, tự nhiên, mượt mà
  • vi-VN-NamMinhNeural — giọng nam, ấm, chuyên nghiệp

▶ Cách 2: Python API — Dành Cho Dân Code

pythonimport asyncio
import edge_tts

async def main():
    communicate = edge_tts.Communicate(
        "Học lập trình không khó, khó là không bỏ cuộc.",
        "vi-VN-HoaiMyNeural"
    )
    await communicate.save("output.mp3")

asyncio.run(main())

Async từ bên trong, phù hợp cho batch processing — generate 100 file audio cùng lúc cũng chơi được .

▶ Cách 3: Phát Ngay Không Lưu File

bashedge-playback --text "Debug xong rồi, về nhà thôi!" \
  --voice vi-VN-NamMinhNeural

Cần cài thêm mpv player. Dùng để test nhanh giọng nào nghe ổn nhất .


Tuỳ Chỉnh Giọng Đọc

Bạn có thể điều chỉnh tốc độ, âm lượng và cao độ theo ý muốn :

bash# Đọc chậm hơn 30%
edge-tts --rate=-30% --voice vi-VN-HoaiMyNeural \
  --text "Từ từ thôi, đừng vội..." --write-media slow.mp3

# Giọng trầm hơn
edge-tts --pitch=-20Hz --voice vi-VN-NamMinhNeural \
  --text "Giọng trầm nghe pro hơn" --write-media deep.mp3

# Âm lượng nhỏ hơn
edge-tts --volume=-40% --voice vi-VN-HoaiMyNeural \
  --text "Thì thầm debug lúc 2 giờ sáng" --write-media whisper.mp3

Tính Năng Nổi Bật: Tự Động Tạo Phụ Đề

Đây là điểm mà nhiều TTS khác không có. edge-tts xuất ra cả file audio lẫn phụ đề SRT/VTT, đồng bộ chính xác từng từ :

bashedge-tts --text "Đây là phụ đề tự động" \
  --write-media video.mp3 \
  --write-subtitles video.srt

Import 2 file vào CapCut, Premiere hoặc DaVinci — phụ đề khớp với audio ngay lập tức, không cần ngồi canh mốc thời gian thủ công .


Ứng Dụng Thực Tế

  • 🎬 Voice-over video tutorial — viết script, chạy lệnh, có audio + phụ đề ngay
  • 📱 TikTok / YouTube Shorts — sản xuất content nhanh, không cần thu âm
  • 🎙️ App đọc tin / đọc truyện — tích hợp vào Flask, FastAPI, Django
  • 📚 E-learning / LMS — tạo audio bài giảng tự động từ nội dung text
  • 🎧 Podcast tự động — kết hợp với script có sẵn, không cần ngồi trước mic
  • 🤖 Pipeline video tự động — edge-tts + n8n + CapCut API = sản xuất video không chạm tay

So Sánh Với Các Công Cụ Khác

Tính năngedge-ttsgTTSAzure SpeechElevenLabs
GiáMiễn phíMiễn phíTrả phíTrả phí
Chất lượngNeural (rất tốt)Cơ bảnNeuralNeural (xuất sắc)
API KeyKhông cầnKhông cầnCầnCần
Phụ đề SRT/VTTKhông
Tiếng Việt2 giọngHạn chế
Tuỳ chỉnh Rate/PitchKhông

Nếu cần chất lượng studio-level thì ElevenLabs vẫn vượt trội hơn — nhưng nếu cần miễn phí + Neural + phụ đề + tiếng Việt, edge-tts là lựa chọn không có đối thủ .


Lưu Ý Trước Khi Dùng

  • Cần internet: edge-tts gọi API Microsoft qua WebSocket, không có chế độ offline
  • Phụ thuộc Microsoft: Dịch vụ có thể thay đổi hoặc bị rate limit nếu dùng quá nhiều — nên có fallback nếu build production
  • SSML hạn chế: Không dùng được SSML phức tạp, chỉ hỗ trợ tag cơ bản
  • Phát âm tên riêng: Giọng tiếng Việt đôi khi phát âm tên riêng hoặc từ vay mượn hơi lạ, nhưng vẫn tốt hơn 90% TTS miễn phí khác

Quick Start — Chạy Ngay Trong 1 Phút

bash# 1. Cài đặt
pip install edge-tts

# 2. Xem danh sách giọng tiếng Việt
edge-tts --list-voices | grep vi-VN

# 3. Tạo file audio + phụ đề
edge-tts --voice vi-VN-HoaiMyNeural \
  --text "Xin chào, đây là bài test giọng tiếng Việt." \
  --write-media test.mp3 \
  --write-subtitles test.srt

# 4. Mở file và nghe thử — bạn sẽ bất ngờ!

edge-tts là một trong những công cụ hiếm hoi mà khi dùng xong, bạn sẽ tự hỏi tại sao mình không biết sớm hơn. Miễn phí, Neural voice, hỗ trợ tiếng Việt, tự tạo phụ đề — quá đủ cho mọi content creator và developer .

🔗 Repo: github.com/rany2/edge-tts
📦 PyPI: pypi.org/project/edge-tts

Leave a Reply

Your email address will not be published. Required fields are marked *