AI

Chuyển âm thanh thành văn bản miễn phí với Google Gemini: Đây là cách thực hiện!

ezgif 3d041c35fed7a9 01

Việc sử dụng AI để chuyển lời nói thành văn bả không phải là điều gì mới mẻ. Các ứng dụng như Otter.ai đã chứng minh là một thay đổi cuộc chơi thực sự trong lĩnh vực này, cho phép chuyển đổi âm thanh có chứa lời nói thành văn bản chính xác, dễ đọc chỉ trong chốc lát.

Tuy nhiên, trong nhiều trường hợp, bạn cần phải trả phí cho các dịch vụ như vậy, đó là lý do tại sao dịch vụ mới nhất của Gemini đang trở nên hấp dẫn. Tải lên một tệp âm thanh, và miễn là nó không vượt quá 10 phút, Gemini sẽ nhanh chóng phân tích và chuyển đổi nó thành văn bản cho bạn — hoàn toàn miễn phí.

Bạn có thể tải lên tối đa 10 tệp âm thanh cùng một lúc, miễn là tổng thời lượng của chúng không vượt quá 10 phút. Gemini cũng có thể được sử dụng để làm sạch bản chép lời, tóm tắt các điểm chính và tìm kiếm thông tin cụ thể trong tệp âm thanh.

1. Thêm tệp âm thanh

Chuyen am thanh thanh van ban mien phi voi Google Gemini 2

Đầu tiên, hãy đảm bảo bạn đang chạy phiên bản Gemini mới nhất nếu bạn đang sử dụng phiên bản ứng dụng, hoặc truy cập trang web Google Gemini.

Sau đó, khi bạn đã sẵn sàng để chuyển một tệp thành văn bản, chọn dấu + và chọn Tải lên tệp (Upload files) trong phiên bản trình duyệt, hoặc chọn Tệp (Files) trong phiên bản ứng dụng.

. Chọn tệp của bạn

Chuyen am thanh thanh van ban mien phi voi Google Gemini 3

Giờ đây bạn sẽ có thể duyệt qua thiết bị của mình để tìm tệp âm thanh bạn muốn chuyển thành văn bản. Gemini có thể làm việc với các định dạng MP3, AAC và WAV.

Chọn tệp âm thanh và nó sẽ được tải vào Gemini, sẵn sàng để sử dụng.

3. Nhập lời nhắc (prompt)

Chuyen am thanh thanh van ban mien phi voi Google Gemini 4

Nhập một lời nhắc (prompt) chẳng hạn như “chuyển lời nói này thành văn bản” (“transcribe this speech”) và Gemini sẽ bắt đầu làm việc. Nếu nó báo lỗi, chỉ cần nhập “thử lại” (“try again”).

Ban đầu tôi đã nhận được một thông báo lỗi sai, nói rằng tệp âm thanh bị trống, mặc dù thực tế không phải vậy. May mắn thay, lần thử thứ hai đã hoạt động ngay lập tức.

4. Làm sạch bản chép lời (transcript)

Chuyen am thanh thanh van ban mien phi voi Google Gemini 5

Gemini sẽ tiến hành chuyển tệp thành văn bản cho bạn. Quá trình này diễn ra rất nhanh chóng, nhưng nó là bản chép lời từng từ nên sẽ có nhiều từ lấp đầy (discourse markers) — chẳng hạn như “ừm” và “à”, nhưng điều đó là điều có thể dự đoán trước.

Bạn có thể sửa lại bằng cách đưa ra lời nhắc (prompt) như “bạn có thể làm sạch nó không?” (“can you clean it up?”), hoặc “bạn có thể xóa các từ ừm đi không” (“can you remove the ums”), và nó sẽ tạo ra một bản chép lời đã được làm sạch, loại bỏ các từ lấp đầy.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *