Spotify cắt giảm nhân viên, đẩy nhanh đầu tư ứng dụng trí tuệ nhân tạo

Sau ba đợt sa thải trong vòng một năm, khoản đầu tư của Spotify vào AI để tăng tỷ suất lợi nhuận cho các bộ phận podcast và audiobook dường như là một “cuộc đại tu hoàn chỉnh” về chiến lược.

Giám đốc Điều hành của ứng dụng nghe nhạc trực tuyến Spotify, Daniel Ek tại một cuộc họp báo ở Tokyo (Nhật Bản). (Ảnh: AFP/TTXVN)
Giám đốc Điều hành của ứng dụng nghe nhạc trực tuyến Spotify, Daniel Ek tại một cuộc họp báo ở Tokyo (Nhật Bản). (Ảnh: AFP/TTXVN)

Theo CNN, Spotify đã tạo dựng tên tuổi của mình trong lĩnh vực kinh doanh “audio streaming” (tạm dịch: “phát âm thanh trực tuyến”) nhờ việc siêu cá nhân hóa trải nghiệm người dùng, dựa trên trí tuệ nhân tạo (AI) và đội ngũ 9.800 nhân viên vào cuối năm 2022.

Nhưng sau ba đợt sa thải trong vòng một năm: 590 vị trí vào tháng Một, 200 vị trí vào tháng Sáu và 1.500 vị trí khác trong tuần trước, khoản đầu tư của Spotify vào AI để tăng tỷ suất lợi nhuận cho các bộ phận podcast và audiobook (sách nói) dường như là một “cuộc đại tu hoàn chỉnh” về chiến lược.

[Các nhà đầu tư và chuyên gia] Phố Wall tin rằng khoản đầu tư của Spotify sẽ phát huy hiệu quả.

Justin Patterson, nhà phân tích nghiên cứu vốn cổ phần tại KeyBanc Capital Markets, cho biết: “Spotify đang tận dụng AI trên nền tảng của mình, ra mắt AI DJ, mô phỏng trải nghiệm radio truyền thống tại 50 thị trường bổ sung và triển khai AI Voice Translation cho podcast.”

“Cùng với việc triển khai audiobook cho ‘premium subscibers’ (người đăng ký trả phí), chúng tôi tin rằng Spotify có một số cơ hội để thúc đẩy mức độ tương tác và sau cùng là khả năng kiếm tiền mạnh mẽ hơn” - chuyên gia Patterson nói.

Cổ phiếu của công ty mẹ Spotify Technology SA đã tăng hơn 30% trong sáu tháng qua, và tăng hơn 135% tính đến thời điểm hiện tại.

Spotify Technology đang cùng với các hãng công nghệ khác cắt giảm chi tiêu khi nhu cầu trong thời kỳ đại dịch đã cạn kiệt. Công ty cũng phải bù đắp hơn 1 tỷ USD đã chi cho mảng podcast.

Phần lớn số tiền trên được dành cho các thỏa thuận với những người nổi tiếng để tạo ra các podcast chưa bao giờ thành hiện thực và mua lại các studio podcast mà sau đó đã phải đóng cửa.

“Tăng trưởng kinh tế đã chậm lại đáng kể và vốn trở nên đắt đỏ hơn. Spotify không phải là một ngoại lệ trước những thực tế này,” - Giám đốc Điều hành (CEO) Daniel Ek viết trong một bức thư gửi nhân viên đăng trên trang web của công ty.

Hợp tác với Google Cloud

Tháng 11 vừa qua, Spotify đã công bố mối quan hệ hợp tác với Google Cloud để cải tiến cách nền tảng này đề xuất audiobook và podcast thông qua việc sử dụng Vertex AI Search - một trong các mô hình ngôn ngữ của Google Cloud.

Các mô hình ngôn ngữ lớn như ChatGPT là các chương trình máy tính được đào tạo trên các tập dữ liệu lớn, có thể đọc lại văn bản và thông tin cho người dùng dựa trên những gì chương trình “biết.”

Spotify đã giới thiệu AI DJ vào tháng Hai và bắt đầu sử dụng công cụ dịch giọng nói Whisper của OpenAI để dịch các tập podcast tiếng Anh chọn lọc sang tiếng Tây Ban Nha, tiếng Pháp và tiếng Đức.

Đại diện của Spotify cho biết trong một email gửi CNN rằng công ty có kế hoạch mở rộng công nghệ này trong tương lai, và hãng đang chờ phản hồi của người sáng tạo và khán giả. Trong một báo cáo thu nhập quý 3 của công ty, CEO Ek đã nhắc đến từ “hiệu quả” hơn 20 lần.

“Cách mà bạn nên nghĩ về những sáng kiến AI này là chúng tạo ra mức độ tương tác lớn hơn, và mức độ tương tác lớn hơn đồng nghĩa chúng tôi sẽ giảm bớt tình trạng gián đoạn” - ông Ek phát biểu trong cuộc họp báo tháng 10 của Spotify.

spotify-2-4131.jpg
Spotify đã siêu cá nhân hóa trải nghiệm cho người dùng trong khoảng một thập kỷ. (Ảnh: AFP/TTXVN)

“Tương tác nhiều hơn cũng có nghĩa là chúng tôi tạo ra nhiều giá trị hơn cho người tiêu dùng. Và tỷ lệ giá trị trên giá đó cho phép chúng tôi tăng giá như chúng tôi đã làm trong quý vừa qua một cách thành công.”

Trong một ghi chú nghiên cứu, Douglas Anmuth, Giám đốc Điều hành và nhà phân tích Internet tại JP Morgan, cho biết cùng với việc đầu tư vào quảng cáo của các nghệ sỹ, đầu tư vào podcast có tiềm năng thúc đẩy sự tương tác trong thời gian dài.

Việc cá nhân hóa hoạt động như thế nào?

Spotify đã siêu cá nhân hóa trải nghiệm cho người dùng trong khoảng một thập kỷ. Hãng đã có thể bổ sung dấu ấn cá nhân đó sau khi mua lại công ty phân tích âm nhạc The Echo Nest Corp vào năm 2014 để kết hợp công nghệ máy học và quá trình xử lý ngôn ngữ tự nhiên.

Công nghệ của Spotify xây dựng cơ sở dữ liệu về các bài hát và nghệ sỹ bằng cách nhận dạng cao độ và nhịp độ âm nhạc, đồng thời kết nối tác phẩm của các nghệ sỹ trong bối cảnh văn hóa chung.

Siêu dữ liệu như ngày phát hành và các số liệu về âm lượng, thời lượng và khả năng một bài hát khiến ai đó nhảy múa… cũng góp phần xác định bài hát nào phù hợp với sở thích của người dùng.

Từ đây, các playlist như “Daily Mix” và “Discover Weekly” ra đời.

Các playlist “Time Capsules” và “On Repeat” tập hợp những bài hát được nghe nhiều nhất của người dùng để khiến người dùng bị cuốn hút vào những gì họ đã nghe hoặc xem lại những bài hát mà họ đã không nghe trong một thời gian.

Trong email gửi CNN, Anil Jain, Giám đốc Điều hành Toàn cầu của Ngành Tiêu dùng Chiến lược tại Google Cloud cho biết Vertex AI Search của họ cho phép các công ty truyền thông và giải trí xây dựng khả năng khám phá nội dung trên video, âm thanh, hình ảnh và văn bản.

Ông Jain không bình luận về bất kỳ chi tiết nào của thỏa thuận với Spotify.

Các mô hình ngôn ngữ lớn

Reece Hayden, nhà phân tích cấp cao tại ABI Research, bày tỏ tin tưởng rằng các mô hình ngôn ngữ lớn (LLM) có thể hoạt động để tăng mức độ tương tác trên nền tảng Spotify.

Ông Hayden viết trong email gửi CNN: “Các mô hình ngôn ngữ lớn có thể nâng cao khả năng cá nhân hóa, cải thiện các đề xuất và đảm bảo các đề xuất phản ánh rõ hơn sở thích của người dùng bằng cách hiểu toàn bộ văn bản hoặc video thay vì sử dụng từ khóa hay siêu dữ liệu.”

spotify-3-9035.jpg
Biểu tượng nền tảng nghe nhạc trực tuyến Spotify tại phòng giải trí bên trong trụ sở của hãng ở Stockholm, (Thụy Điển). (Ảnh: AFP/TTXVN)

Không giống như “các mô hình dự đoán cơ bản phụ thuộc vào từ khóa hay siêu dữ liệu,” LLM có thể hiểu và diễn giải các podcast để xem liệu chúng có phù hợp với sở thích của người dùng hay không. LMM cũng có thể phân tích tất cả dữ liệu người dùng để hiểu sâu hơn về sở thích của họ.

Tuy nhiên, “việc chạy LLM để hiểu tất cả podcast/audiobook tiêu tốn nhiều tài nguyên và có thể tăng thêm giá trị hạn chế so với các mô hình dự đoán cơ bản… LLM mang đến những thách thức bổ sung về quyền riêng tư dữ liệu và chi phí/tài nguyên - những thách thức này sẽ rất đáng kể” - ông Hayden nói.

Ông Hayden bày tỏ niềm tin rằng Whisper sẽ giúp dịch podcast, nhưng thừa nhận rằng công cụ này có thể mắc sai sót dưới dạng câu hoặc cụm từ trong quá trình AI tạo sinh học hỏi.

“Với sự sẵn có của các điểm dữ liệu, các mô hình dịch ngôn ngữ khác nhau như Whisper sẽ nhanh chóng được cải thiện, đảm bảo độ chính xác cao” - ông nói.

“Nhược điểm của Whisper nằm ở chỗ khả năng cốt lõi của công cụ này là dịch từ các ngôn ngữ khác sang tiếng Anh. Hầu hết các podcast đều được ghi âm bằng tiếng Anh và do đó Whisper không thể được áp dụng một cách hiệu quả trên diện rộng.”./.

(Vietnam+)

Tin cùng chuyên mục