AI och Röst – Nya möjligheter

Ideella Föreningen World Voice firar Världsröstdagen 2025

i samarbete med Institutionen för Lingvistik, Stockholms Universitet,

med stöd av Rothenberg Foundation och Röstforum Stockholm

Onsdagen den 23 april, 18.30 – 21.00

Hörsal 11 i Södra huset, Stockholms Universitet, plan 3

Rösten är vårt vanligaste och kanske viktigaste verktyg för kommunikation. Men det är inte bara människan som har en röst att prata med, nu kan också artificiella och ’intelligenta’ system också prata. ‘AI-röster’ öppnar helt nya möjligheter och de utvecklas i en otrolig takt.

‘AI-röster’ kan användas utan att behöva förknippas med en specifik fysisk person. De kan verka i miljöer som är otillgängliga för människor, till exempel i virtuella världar eller applikationer som aldrig stängs av. De kan ge människor en ‘andra röst’ och de kan till och med uttrycka känslor och kanske en personlig bakgrund. De kan också ge konstnärer helt nya och fascinerande möjligheter i skapandet. Dessutom kan sådana röster fungera som verktyg för att ge återkoppling på sådant vi kanske inte klarar av på egen hand, t ex att utvecklas som talare och sångare.

Den 23 april 2025 kl. 18.30-21.00 i Stockholm kommer experter från olika områden att samlas för att berätta om nya möjligheter som AI-röster öppnar.

Program

Världsröstdagen: Varför – Vadan – Varthän?

Rebecca Häller, sångpedagog, vokalist, ordförande

Att tämja AI-röster.

Joakim Gustafsson, professor i talteknologi på KTH

AI-röster som vokalister: Vem har upphovsrätten?

Katja de Vries, jurist, expert på AI-skapade data and “deepfakes”

Rösten för sig – Kompet för sig – Vokalseparering med AI.

Patrik Ohlsson, Machine-Learning expert, DoReMIR Music Research

Paus

Artificial Voices: Three Perspectives.

Bob L. T. Sturm, universitetslektor, KTH

Joris Grouwels och Elin Kanhov, doktorander, KTH

AI-rösten: Tekniken från 2024 du behöver lära dig nu.

Fredrik Boltes, tv-producent, sångare och stand-up-komiker

Välkomna att fira Världsröstdagen med en kväll om röstens enorma betydelse – för våra liv, samhället, kommunikationen och demokratin.

Moderator: Christine Ericsdotter Nordgren

Inträde: Gratis

Beskrivning av programpunkter

Att tämja AI-röster

Inom fonetik och språkvetenskap vill vi kunna ha fin kontroll på låg nivå (aspekter som prosodi, röstkvalitet och fyllda pauser). Genom att generera samma mening på olika sätt kan vi sen se hur dessa aspekter påverkar folks uppfattning av talaren (känsloläge, säkerhet, kompetens mm).
Inom interaktionsforskning vill kunna studera hur vi kan skapa syntetiska talare som agerar som lärare, instruktör eller underhållare. Då vill vi styra på högre nivåer där vi väljer en viss röst med en viss talstil, där vi låter AI-systemet inspireras av hur en människa talar i en viss situation. I dessa fall vill se om sätten man talar påverkar hur mycket man lär sig, kognitiv belastning eller underhållningsvärde.

AI-röster som vokalister: Vem har upphovsrätten?

Under de senaste åren har generativ AI tagit världen med storm – på gott och ont. Framstegen inom TTS (text-to-speech) gör det numera möjligt att skapa verklighetstrogna syntetiska röster som härmar dialekter/sociolekter, andningsljud, intonationer och känslor, inklusive röstkloner av specifika mänskliga röster.

Syntetiska röster används allt oftare i spel, filmer, musik, ljudböcker, smarta högtalare och chatbots. I ett tekniskt perspektiv innebär det att du kan få din e-post, tidning eller roman uppläst av en röst som exempelvis liknar Astrid Lindgrens, rapparen Snoop Doggs eller din avlidna mormors. Men vad gäller rättsligt? Hur ska AI-röster regleras? Vad bör samhället sträva efter?

Avsaknaden av klarhet kring det rättsliga skyddet för AI-genererade röster är problematisk. Katja de Vries är projektledaren i den tvärvetenskapliga forskningsmiljön “VOICE. AI-skapade röster. Rättsliga och samhälleliga perspektiv” (Vetenskapsrådet, 2025-2030) som syftar att studera den här frågorna. Frågan om vems röster vi hör och vem som tjänar på det har stora samhälleliga återverkningar – demokratiska, kulturella, symbolisk

Rösten för sig – Kompet för sig – Vokalseparering med AI.

Att kunna separera ut individuella instrument eller sångare ur en ljudinspelning var endast en dröm för ljudnördar och musiker för inte alltför länge sedan. De senaste tio åren har teknologin rusat fram och idag har källseparering blivit en nyckel till högkvalitativ brusreducering, ljudreparation, och musikanalys.

Vokalseparering är en teknik som isolerar sång från övriga ljudkomponenter i en ljudinspelning, som instrument eller bakgrundsljud. Genom avancerad AI, inklusive maskininlärning och neurala nätverk, kan moderna system identifiera och separera dessa element med hög precision. Tekniken bygger på modeller tränade på stora datamängder, vilka lär sig känna igen mönster i både röst och instrument.

Vi tittar närmare på hur AI möjliggör vokalseparering och dess aktuella applikationer.

Artificial Voices: Three Perspectives.

We will talk about AI and the voice from three perspectives: engineering, musicology, and performance practice. Bob will provide an overview of how AI is being developed to clone voices. Elin will give a musicological perspective on voice and AI, focusing on aspects such as identity, discourses of deepfake, and artists using AI voice models for aesthetic exploration. Joris will discuss how simulated models of the voice can be used to study the practice of singing.

AI-rösten: Tekniken från 2024 du behöver lära dig nu.

Vad kunde man göra med Voice-to-text, Text-to-voice och Voice-to-voice redan 2024? Fredrik Boltes, känd som sångare, tv-producent och stand-up-komiker, men också datanörd, lär ut konkreta och praktiska AI-tekniker i en kul och interaktiv workshop. Lär dig generera och imitera röster, använda röststyrning, text-to-speech och mer. Gå hem med grunderna i AI:s möjligheter från 2024!

KÖRSÅNGARES RÖSTFÖRÄNDRINGAR GENOM LIVET

Florian Benfer,
universitetslektor Örebro universitet, dirigent för Gustaf Sjökvists kammarkör

Sångarens röst är ett mycket känsligt instrument, och kören – d v s summan av dess sångare – är en ömtålig ensemble. Små variationer i den individuella dagsformen kan ha stor inverkan på gruppens prestation.

När man varje vecka arbetar med en homogen körklang och ett gemensamt musikaliskt uttryck räcker det ofta med en liten väderförändring eller att en enda sångare saknas i gruppen för att få ett starkt inflytande på arbetsprocessen. Detta leder i sin tur ofta till ett annorlunda klangligt resultat. Ännu större, om än långsammare, är de förändringar som följer med körmedlemmarnas åldrande.

Hur hanterar körledarna detta? Vilka erbjudanden finns för seniorer och hur kan körledare bidra till att sångare kan fortsätta sjunga aktivt i kören långt upp i åldern? Dessa frågor sysselsätter nästan alla körledare. Och ju fler seniorkörer som bildas i Sverige och i många andra länder, desto mer ökar medvetenheten om åldersanpassat körarbete.

Världsröstdagen 2024. 14 april 2024 kl 13.00–16.30.
Kungl Musikhögskolan, Valhallavägen 105, Stockholm.
Fri entré.

Author: admin

Världsröstdagen 2025

AI och Röst – Nya möjligheter

Ideella Föreningen World Voice firar Världsröstdagen 2025

Onsdagen den 23 april, 18.30 – 21.00

Program

Världsröstdagen: Varför – Vadan – Varthän?

Att tämja AI-röster.

AI-röster som vokalister: Vem har upphovsrätten?

Rösten för sig – Kompet för sig – Vokalseparering med AI.

Paus

Artificial Voices: Three Perspectives.

AI-rösten: Tekniken från 2024 du behöver lära dig nu.

Beskrivning av programpunkter

AI-röster som vokalister: Vem har upphovsrätten?

Rösten för sig – Kompet för sig – Vokalseparering med AI.

Artificial Voices: Three Perspectives.

AI-rösten: Tekniken från 2024 du behöver lära dig nu.

Mer på Världsröstdagen 2024, #5