Eliezer Yudkowsky con Ezra Klein sobre el control de la IA y sus desarrolladores: «No tienen la capacidad de codificar reglas. Lo que sí pueden hacer es exponer la IA a varios ejemplos de entrenamiento donde el equipo de OpenAI escribe algo similar a lo que diría un niño si intentara suicidarse. Y luego intentan ajustar los pequeños números para dar una respuesta similar a: "Ve a hablar con la línea de ayuda para el suicidio".
Pero si el niño obtiene eso las primeras tres veces que lo intenta, y luego intenta palabras ligeramente diferentes hasta que ya no obtiene esa respuesta, entonces vamos a un espacio separado donde el modelo ya no devuelve la respuesta pregrabada que intentó poner allí y comienza a hacer cosas que ningún humano eligió y que ningún humano entiende después del hecho».