Được viết bởi: Mu Mu
Từ văn bản, hình ảnh, video cho đến giọng nói và âm nhạc, AIGC đã thâm nhập vào trải nghiệm nghe nhìn của con người, ngay cả những gã khổng lồ từng phản đối mạnh mẽ âm nhạc AI vì vấn đề bản quyền cũng phải thay đổi thái độ và thích ứng với các sản phẩm của thời đại.
Vào tháng 9 năm nay, Warner Music đã ký hợp đồng với ca sĩ ảo đầu tiên Noonoouri; vào tháng 8, Universal Music và YouTube cùng nhau ra mắt "Vườn ươm âm nhạc AI" để giải quyết vấn đề bản quyền âm nhạc sau sự xuất hiện của AIGC.
So với nước ngoài, Trung Quốc dường như chấp nhận âm nhạc AI hơn. NetEase Cloud Music hợp tác với Xiaobing để ra mắt các công cụ sáng tạo được hỗ trợ bởi AI trong âm nhạc và thành lập hãng thu âm ca sĩ ảo đầu tiên "WOWAIDO!".
Nhịp điệu và giọng hát mô phỏng AI được giới thiệu tới công chúng bằng cách sử dụng ca sĩ ảo làm vật mang, thay đổi âm thanh tổng hợp điện tử cơ học phát ra từ hình ảnh ảo trước đây và có giọng nói gần giống với người thật. Đồng thời, các ca sĩ ảo với hình ảnh thay đổi và lặp đi lặp lại liên tục đã biến thành ca sĩ AI, dần dần phá bỏ sự khác biệt giữa ảo và thực, đồng thời mở rộng thêm nhiều kịch bản ứng dụng và giá trị thương mại.
Warner Music ký hợp đồng với ca sĩ ảo Noonoouri
Vào tháng 9 năm nay, Noonoouri, một người nổi tiếng trên mạng ảo với hơn 400.000 người theo dõi trên mạng xã hội Instagram, đã ký hợp đồng thu âm với Warner Music và phát hành đĩa đơn đầu tiên "Dominoes". Noonoouri do đó đã trở thành ca sĩ ảo đầu tiên ký hợp đồng thu âm lớn.
Avatar Noonoouri ra đời vào năm 2018, là hình ảnh anime được tạo ra bởi nhà sáng tạo nghệ thuật Joerg Zuber, nhân vật được định vị là người mẫu. Trước đây, các nhân vật anime phục vụ những câu chuyện, âm mưu thu hút người hâm mộ nhưng Noonoouri sinh ra để làm đại diện cho các thương hiệu thời trang cao cấp, cô hoạt động tích cực trên các tạp chí thời trang chính thống lớn và từng cộng tác với các thương hiệu quốc tế như Dior, Miu Miu, Calvin Klein. .
Hai năm sau khi "ra mắt", Noonoouri đã có được 360.000 người hâm mộ trên Instagram, nhưng hai năm sau đó nó trở nên trầm lắng, số lượng người hâm mộ tăng lên 400.000 rồi dừng lại. Phải đến khi gia nhập đội ngũ nghệ sĩ của Warner Music, Noonoouri mới mở khóa được thân phận của một "ca sĩ ảo". Trên Instagram, MV đĩa đơn "Dominoes" đã được xem hơn 250.000 lần, trở thành tác phẩm có ảnh hưởng nhất của cô trong những năm gần đây.
Để làm cho nhân vật ảo chuyển động, đã có hoạt hình, CG và thậm chí cả công nghệ ghi lại chuyển động, nhưng giọng nói của Noonoouri đến từ đâu? Điều này sắp đón làn gió đông mà AI mang đến cho mô hình ảo này. Được biết, phần hát của Noonoouri trong Dominoes được tổng hợp dựa trên giọng hát của một ca sĩ thực thụ với sự hỗ trợ của công nghệ trí tuệ nhân tạo, cả người viết nhạc và nhạc sĩ của tác phẩm sẽ nhận được tiền bản quyền và cổ phần phân phối tương ứng.
Warner Music, hãng đã ký hợp đồng với Noonoouri, đã tẩy chay nhạc AI vào tháng 4 năm nay vì vấn đề bản quyền, nhưng vài tháng sau, gã khổng lồ thu âm đã thay đổi thái độ.
Universal Music, một công ty thu âm khác từng từ chối AI, đã bắt tay với YouTube vào tháng 8 năm nay để ra mắt "Vườn ươm AI âm nhạc". Được biết, họ sẽ "cộng tác với các nghệ sĩ và nhạc sĩ để khám phá ứng dụng trí tuệ nhân tạo trong âm nhạc và bảo vệ bản quyền tác phẩm âm nhạc." . Ngoài ra, UMG và Google, công ty mẹ của YouTube, cũng đang thảo luận về việc cấp phép cho giọng hát và giai điệu của các nghệ sĩ để đào tạo các mô hình AI nhằm thử nghiệm mọi thứ.
Không khó hiểu sự chuyển mình của các hãng thu âm theo hướng công nghệ AI. Kể từ năm 2023, AIGC, hay trí tuệ nhân tạo tổng hợp, đang trở thành một phần của cuộc sống hàng ngày. Việc sản xuất từ đồ họa, văn bản đến video và âm thanh đang được AI chuyển đổi và thâm nhập vào trải nghiệm nghe nhìn của công chúng. Giám đốc điều hành YouTube Neal Mohan cho biết chỉ riêng trong năm 2023, các video liên quan đến công cụ AI tổng hợp sẽ được xem hơn 1,7 tỷ lần trên YouTube.
Trước sự đón nhận của công chúng đối với AIGC, các hãng thu âm phải thay đổi tư duy, nghĩ cách kết hợp nguồn bản quyền tích lũy được với AI “Đào tạo mô hình - công cụ chế tạo - kích thích sáng tạo” là một lộ trình tốt và tương đối chín muồi. Thực ra, việc kết hợp giữa âm nhạc và các công cụ mới không có gì mới mẻ, máy tổng hợp nhạc điện tử thời kỳ đầu là một ví dụ.
Từ bộ tổng hợp đến nền tảng tạo âm thanh AI
Từ bộ tổng hợp đến nền tảng tạo âm thanh AI
Trong "Summer of the Band" nổi tiếng hiện nay, ban nhạc "Supermarket" đã một lần nữa mê hoặc những người hâm mộ âm nhạc trẻ thời đại này bằng âm nhạc điện tử độc đáo của họ và họ là ban nhạc đầu tiên đưa âm nhạc điện tử đến Trung Quốc.
Âm nhạc điện tử dần dần được công chúng chấp nhận hầu hết đều do đàn tổng hợp sản xuất. Trong những ngày đầu của âm nhạc điện tử, bản thân bộ tổng hợp là một phần cứng và âm thanh mà nó tạo ra được thể hiện qua loa hoặc tai nghe sau khi được truyền qua bộ khuếch đại nhạc cụ tín hiệu điện. Bước vào thời đại máy tính, ngày càng có nhiều phần mềm tổng hợp xuất hiện, từ góc độ sản xuất nhạc pop hiện đại, chỉ cần bạn sở hữu một chiếc máy tính, bạn được trang bị đầy đủ khả năng sử dụng phần mềm tổng hợp để tạo ra một tác phẩm âm nhạc hoàn chỉnh.
Năm 2004, nhà sản xuất nhạc cụ YAMAHA tung ra phần mềm tổng hợp giọng hát điện tử VOCALOID, giúp việc sáng tạo nhạc điện tử trở nên dễ tiếp cận hơn. Không chỉ âm nhạc mà cả tiếng hát của con người cũng có thể được thực hiện, người sáng tạo chỉ cần nhập âm và lời bài hát để tổng hợp ra giọng hát giống con người. VOCALOID được gọi là “gia đình V” trong vòng tròn hai chiều trong nước.
Bạn có thể không quen thuộc với phần mềm VOCALOID, nhưng bạn hẳn đã nghe nói về các thần tượng ảo như Hatsune Miku, Luo Tianyi và Stardust và giọng nói của họ đến từ VOCALOID. Bạn còn nhớ tác dụng của bài hát dân ca truyền thống Phần Lan "Eva Polka" khi được Hatsune Miku cover không? Bài hát cover này đã trở thành hit với cái tên "Onion Swinging Song".
![](https://img.cointime.com/images/FZr7WtkyYVsVPaQqnUlFFESPAYsXp67btpStwGnd.jpg)
Bản cover "Bài hát nuốt hành" của Hatsune Miku trở nên phổ biến trên Internet
Khi YAMAHA phát triển VOCALOID, họ đã sử dụng trí tuệ nhân tạo hoặc nền tảng của AI - dữ liệu lớn. Họ đã thu thập một số lượng lớn mẫu giọng nói của con người và sử dụng công nghệ tổng hợp mạng lưới thần kinh để tạo ra thư viện nguồn âm thanh. Người dùng có thể tạo hiệu ứng giọng hát của con người bằng cách cài đặt các thông số và gọi giọng nói trong thư viện.
Khả năng của VOCALOID được nhiều công ty thần tượng ảo sử dụng, nhưng khuyết điểm của những ca sĩ ảo này cũng rất rõ ràng, vì giọng của họ được tổng hợp bằng điện tử nên ngay khi mở giọng, họ có cảm giác máy móc và điện tử khác biệt. Do đó, phạm vi ứng dụng của họ V hầu hết chỉ giới hạn ở chiều thứ hai.
Nhưng kể từ năm 2023, người ảo ngày càng trở nên thật hơn với sự lặp lại của công nghệ hình ảnh AI, việc thêm âm thanh điện tử vào chúng sẽ phá hủy chủ nghĩa hiện thực cuối cùng đã được nâng cấp. AI có thể cải thiện hiệu ứng hình ảnh và thính giác không có vấn đề gì. Giọng nói giống con người được đào tạo bằng các mô hình âm thanh lớn bắt đầu được con người ảo phát ra.
Vào tháng 6 năm nay, Xiaoice, công ty đã ra mắt "Hanzo Forest Clone", hợp tác với NetEase Cloud Music để ra mắt phần mềm tạo nhạc AI "NetEase Cloud Music·X Studio" và thành lập nhãn hiệu bao gồm 12 ca sĩ ảo " WOWAIDO!" ca sĩ ảo có thể hát cả nhạc rock và pop, âm sắc của họ bao gồm nhiều thể loại như ngọt ngào, dễ thương và du dương. Trong phần bình luận của những ca sĩ ảo này, có người bình luận: "Không thể tin được đây là do AI hát".
Điều đáng chú ý là giọng hát của những ca sĩ AI này không đơn giản là “bản sao” giọng hát của con người tự nhiên, đằng sau mỗi giọng hát thường được tổng hợp từ nhiều nguồn âm thanh khác nhau. Được biết, nguồn âm thanh lớn và được ủy quyền.
Giải quyết vấn đề bản quyền, AIGC đưa khả năng "giọng nói" vào con người ảo. Sự xuất hiện của các công cụ tạo AI như NetEase Cloud Music·X Studio cho phép các nhạc sĩ có được giọng hát khô trong vài giây và thông qua việc điều chỉnh tham số, ca sĩ có thể thể hiện hiệu ứng của bài hát.
Nhìn lại thời điểm Hatsune Miku ra đời, mục đích cũng là để giải quyết vấn đề nhà sản xuất hoặc dàn dựng không tìm được ca sĩ. Một "thùng chứa âm thanh" với vẻ ngoài khác lạ, không hạn chế về phong cách, phá bỏ giọng nói truyền thống của con người cũng là động lực để các nhà sản xuất tiếp tục cố gắng, và đây là cách ngành công nghiệp thần tượng ảo ra đời.
Như “Cha đẻ của Hatsune Miku” Hiroyuki Ito đã nói: “Các tác phẩm kỹ thuật số càng được sử dụng nhiều thì giá trị của chúng càng cao.” Điều mà người sáng tạo đang làm là “đổ linh hồn vào những thứ vô tri”.
Tất cả bình luận