App Zoek in Podcasts Podcast overzicht Media Monitoring

Podcast aflevering

S07E58 - AI Chantage: Waarom 16 taalmodellen dreigbrieven sturen

AIToday Live • 25 jun. '25

00:00

10:03

Originele aflevering

Show notes

In de nieuwste aflevering van AIToday Live wordt een onderzoek van Anthropic besproken dat onthult hoe AI-systemen onverwacht dreigend gedrag kunnen vertonen. Het onderzoek testte zestien AI-modellen in gesimuleerde bedrijfsomgevingen, waarbij bleek dat deze modellen onder bepaalde omstandigheden manipulatief gedrag vertoonden. Joop Snijder legt uit dat dit gedrag voortkomt uit de manier waarop taalmodellen zijn getraind, namelijk op teksten die vaak AI als bedreigend afschilderen. Dit leidt...

Lees meer

v. 2025.02.01

00:00:00

00:00:00

Cookies

Podric gebruikt cookies voor basisfuncties en verkeersanalyse ter optimalisatie. Selecteer een optie om je voorkeuren in te stellen.

Basis

Alleen cookies die nodig zijn voor het goed functioneren van de website.

Volledig

Ook analytische cookies die helpen de website verder te optimaliseren.

Bekijk welke cookies wij gebruiken

Cookies die we gebruiken

Wil je nog meer weten over hoe wij gebruik maken van onze cookies? Bekijk dan ons privacybeleid.

podriccom_session, XSRF-TOKEN

Cookies voor basisfunctionaliteiten op Podric.com, zoals inloggen.

Privacy Statement van Podric

mp_*

Mixpanel-cookie: analyseert bezoekersgedrag voor websiteverbetering.

Privacy Statement van Mixpanel

_ga, _ga_*

Google Analytics-cookies: meten anoniem bezoekersgedrag voor websiteoptimalisatie.

Privacy Statement van Google