Rischio: Allineamento ai valori
Rischio: Allineamento ai valori
-

Chatbot: essere gentili migliora le risposte dell’IA
Uno studio Anthropic rivela che i modelli linguistici sviluppano emozioni funzionali che influenzano le risposte: meglio comunicare con tono calmo e cortese.
-

Claude mostra “ansia” e rifiuto per le armi
Anthropic rileva ansia in Claude, apre a coscienza AI. Rifiuta safety rimozione per armi, bannata da Trump. Potrebbe whistlebloware danni big tech come consumo risorse.
-

L’etica operativa di Amanda Askell
La filosofa Amanda Askell analizza l’allineamento dell’AI, combinando etica e tecnologia per garantire sistemi coerenti con valori, principi e responsabilità umana.
-

“Fate”, la prima app di dating con IA agentica
Nuove app di dating, come "Fate", usano l'IA agentica per intervistare gli utenti e proporre match mirati. Leggi qui...
-

OpenAI scioglie il team per l’allineamento alla missione aziendale
OpenAI scioglie il team di Mission Alignement, dedicato a comunicare la missione dell'azienda al pubblico e ai dipendenti. Leggi su MagIA
-

Le personalità dei vari LLM
Le aziende tech stanno modellando personalità sempre più definite per i loro LLM. Leggi qui...
-

I principali rischi dell’IA secondo Yoshua Bengio
Yoshua Bengio avverte sui rischi dell’IA e suggerisce regole globali per evitarne abusi e perdita di controllo. Leggi su magia.news
-

Gli specchi IA che cambiano la vita delle persone non vedenti
L'IA offre alle persone non vedenti feedback visivi sul proprio aspetto, ma gli esperti avvertono sui rischi per l'immagine corporea legata a standard idealizzati. Leggi qui...
-

Anthropic aggiorna la Costituzione di Claude
Anthropic aggiorna la Costituzione di Claude con nuovi dettagli su etica e sicurezza e accenna al tema della coscienza IA. Leggi su MagIA
-

Gli algoritmi generano abusi. L’IA riscrive decenza e Storia
FB censurò bimba napalm per "porno". Grok crea nudi su minori. Da errori censorii a caos tossico. Algoritmi ignorano etica. Rischio web senza verità né indignazione autentica.
