Thứ Hai ngày 04 tháng 11 năm 2024

Trải nghiệm tìm nhạc bằng giọng nói nhờ trí tuệ nhân tạo trên Zing MP3

Với việc dịch vụ nghe nhạc streaming Zing MP3 tích hợp trợ lý giọng nói tiếng Việt, người dùng có thể tìm kiếm nhạc trên ứng dụng này bằng giọng nói mà không cần thao tác tay như trước.

Hiện nay trên thị trường không thiếu các trợ lý tiếng nói có thể giúp bạn tìm và chơi một bài nhạc yêu thích mà không cần phải thực hiện quá nhiều thao tác, bao gồm Alexa của Amazon, Siri của Apple, Google Assistant, và thậm chí cả Bixby của Samsung. Tuy nhiên, rất ít các ứng dụng nghe nhạc tích hợp trợ lý ảo để hỗ trợ nhu cầu này của người dùng.  

Với Zing MP3, người dùng trên iOS và Android chỉ cần ra lệnh bằng giọng nói ngay trong ứng dụng để tìm nhạc mà không cần phải nhập dữ liệu bằng tay như trước đây.

Công nghệ AI nào đang được sử dụng trên trợ lý tiếng nói?

Là nền tảng nghe nhạc trực tuyến uy tín nhất thị trường Việt Nam, Zing MP3 sở hữu hơn 85% bản quyền nhạc Việt, trong đó khoảng 80% là các bản ghi phát hành độc quyền. Bên cạnh việc sở hữu kho nhạc Việt khổng lồ, gần đây Zing MP3 chính thức trở thành đối tác với các hãng thu âm và sản xuất nhạc hàng đầu thế giới, phân phối nhạc quốc tế có bản quyền cho người dùng Việt Nam. Tuy nhiên, với lượng lớn bài hát phát hành mỗi ngày như vậy, việc tìm kiếm bài hát yêu thích có thể gây tốn kém thời gian, đặc biệt trong những hoàn cảnh không rảnh tay như đang đi trên đường. Vì vậy, tính năng ra lệnh bằng giọng nói trên Zing MP3 cho phép người dùng tiết kiệm thời gian tìm nhạc chỉ với một vài thao tác đơn giản.  

Trợ lý ảo sử dụng công nghệ xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP) là công nghệ giúp máy tính hiểu cách con người giao tiếp và phản hồi. Theo đó, quy trình NLP sẽ diễn ra như sau: khi người dùng ra lệnh, trợ lý tiếng nói sẽ sử dụng công nghệ nhận dạng giọng nói tự động (Automatic Speech Recognition – ASR) để tiếp nhận thông tin giọng nói và chuyển dữ liệu giọng nói thành văn bản. Công nghệ phân tích ý định người dùng (Natural Language Understanding – NLU) sẽ giúp máy hiểu ý định người dùng. Lúc này, hệ thống sẽ thực hiện xử lý ý định người dùng dựa trên dữ liệu nhạc, sở thích mỗi người sau đó đưa ra câu trả lời tương ứng. Cuối cùng, câu trả lời này sẽ được chuyển đổi thành âm thanh (Text to Speech – TTS) và cuối cùng là phát dữ liệu âm thanh cho người dùng.

Quy trình này nghe có vẻ dễ thực hiện, nhưng không phải vậy. Ngôn ngữ của con người rất phức tạp để máy tính có thể hiểu được. Điểm mấu chốt là quá trình NLP phải giúp trợ lý tiếng nói hiểu các ý nghĩa đàng sau các cụm từ bằng cách phân tích cú pháp, ngữ nghĩa, giọng vùng miền, thậm chí tiếng lóng của người nói. Đây là một thách thức lớn vì nó là một lĩnh vực kết hợp giữa khoa học máy tính, trí tuệ nhân tạo AI và ngôn ngữ học. Dù công nghệ nhận dạng giọng nói đã phát triển nhanh chóng trong những năm gần đây, nhưng các thiết bị điều khiển bằng giọng nói với độ chính xác cao vẫn có thể hiểu sai các ngữ cảnh.  

Điều quan trọng trong bài toán tìm nhạc của Zing MP3 là phải xử lý được các hành vi và thói quen nghe nhạc của người dùng như phát âm sai, nhớ sai tên bài hát, hay chỉ thuộc một đoạn trong lời, thậm chí phần thuộc đó cũng không chính xác. Chính vì vậy, ngoài công nghệ nhận dạng giọng nói tự động (ASR), trợ lý tiếng nói của Zing MP3 có thể giải quyết bài toán nhận biết lời bài hát cũng như dự đoán tên bài hát gần chính xác để trả lại kết quả theo đúng yêu cầu của người dùng.   

Ưu điểm của tính năng này trên Zing MP3 là khả năng nhận diện giọng nói bằng tiếng Việt, thậm chí là giọng địa phương và phản hồi bằng tiếng Việt tự nhiên nhờ vào công nghệ chuyển đổi dữ liệu thành âm thanh (TTS). Hiện nay trên thế giới, các trợ lý tiếng nói đa số sử dụng tiếng nước ngoài, hiếm có trợ lý hỗ trợ tiếng Việt. Ưu thế này giúp việc tìm nhạc bằng giọng nói trên Zing MP3 gần gũi, tiện lợi đối với người dùng đại chúng tại Việt Nam. 

Sử dụng trợ lý tiếng nói trên Zing MP3

Để sử dụng tính năng điều khiển bằng giọng nói trên Zing MP3, người dùng cập nhật phiên bản Zing MP3 mới nhất. Sau đó vào màn hình chính của ứng dụng, chọn biểu tượng micro ở góc bên phải trên cùng màn hình để cấp quyền cho trợ lý ảo bằng cách nhấn mục “Cho phép”. Các thao tác tìm nhạc sẽ chỉ được thực hiện khi nhấn vào biểu tượng micro để kích hoạt.

Ngay sau đó, trên màn hình sẽ hiển thị trợ lý ảo và giới thiệu cho người dùng các tiện ích điều khiển bằng giọng nói như như mở và dừng nhạc, chuyển nhạc, hẹn giờ tắt nhạc, tìm kiếm thông tin ca khúc và nghệ sĩ, thêm bài hát vào danh sách yêu thích… Từ đó, người dùng bắt đầu ra lệnh cho trợ lý ảo bằng giọng nói của mình. 

Người dùng có thể mở ca khúc hoặc tìm nhạc của nghệ sĩ yêu thích hoàn toàn bằng giọng nói của mình. tHí dụ, khi muốn nghe ca khúc Sóng gió, người dùng sử dụng câu lệnh “Mở bài hát Sóng gió” và ngay sau đó trình phát nhạc sẽ mở bài hát này. Hay khi muốn thưởng thức các sản phẩm của Đức Phúc, người dùng chỉ cần ra lệnh cho trợ lý ảo “Mở nhạc của Đức Phúc”. Trình phát nhạc sẽ mở danh sách phát các ca khúc của nam ca sĩ này. 

Với lợi thế về kho nhạc khổng lồ, trợ lý ảo của Zing MP3 cũng sẽ gợi ý các bài hát theo thể loại, tâm trạng và hoạt động của người dùng. Với thể loại nhạc, người dùng sử dụng các câu lệnh như “Mở nhạc rap”, “Nghe nhạc EDM”, “Mở nhạc Hàn Quốc”, “Bật nhạc Âu Mỹ”… Khi muốn thưởng thức nhạc phù hợp với tâm trạng và hoạt động hiện tại, người dùng có thể ra lệnh như “Mở nhạc buồn, “Mở nhạc vui”, “Bật nhạc để đi du lịch”, “Bật nhạc để làm việc”… Sau đó, trợ lý ảo sẽ phát playlist theo chủ đề thích hợp với câu lệnh. 

Điểm thú vị của trợ lý ảo Zing MP3 là mở nhạc theo lời bài hát. Ở nhiều ngữ cảnh như khi đi trên đường vô tình nghe một bản nhạc quen thuộc nhưng không nhớ tên ca khúc, sau khi kích hoạt trợ lý tiếng nói, người dùng chỉ cần đọc lời bài hát để trình phát nhạc mở đúng ca khúc. Thí dụ như “Mở bài Anh thật sự ngu ngốc” (lời bài hát Em không sai chúng ta sai), “Mở bài Gió lung lay bàn tay nâng cánh hoa tình” (lời bài hát Ai mang cô đơn đi).

  • Video Tăng Phúc & Trương Thảo Nhi (chủ nhân bản hit Chỉ là không cùng nhau) trải nghiệm tìm nhạc bằng trí tuệ nhân tạo. Xin click vào đầy để xem.

Trợ lý tiếng nói có thể làm được nhiều việc hơn

Bên cạnh tính năng tìm nhạc, người dùng có thể điều khiển bằng giọng nói các tiện ích khác trên ứng dụng Zing MP3 như mở bài tiếp theo hoặc trước đó, tăng/giảm âm lượng, hẹn giờ tắt nhạc. Không chỉ điều khiển nhạc trên Zing MP3, người dùng có thể tìm kiếm thông tin nghệ sĩ thông qua trợ lý thông minh này. Ngoài ra có thể hỏi thêm các thông tin khác như thời tiết, giá vàng.  

Hiện nay, người dùng Zing MP3 đã có thể kết nối ứng dụng này trên xe hơi và thực hiện các tác vụ rảnh tay như bật tắt nhạc, tìm nhạc, tìm đường trên xe. Để kích hoạt trợ lý tiếng nói này, chỉ cần nhấn nút “tiếp theo” (next) hai lần là đã có thể kích hoạt trợ lý tiếng nói. An toàn hơn khi đang lái xe và thao tác nhanh hơn. 

Công nghệ ra lệnh bằng giọng nói đã phát triển mạnh mẽ trong những năm gần đây. Việc ứng dụng công nghệ này trở thành một bước tiến thiết yếu và sáng tạo của Zing MP3 trong những nỗ lực mang đến những trải nghiệm tốt nhất cho hàng chục triệu người dùng thường xuyên của mình. Gần đây, Zing MP3 liên tục cập nhật các tính năng nổi bật khác như miễn phí nghe nhạc chất lượng cao 320Kbps, cá nhân hóa playlist theo sở thích người nghe, hát karaoke, tính năng phòng nhạc, tính năng theo dõi trang cá nhân của nghệ sĩ. 

MEDIAONLINE

+ Nguồn và ảnh: Nhóm Truyền thông Zing.