Cómo evitar que tus datos se utilicen para entrenar IA

Rosslyn Elliott / Actualizado Apr 26, 2024 | Pub. 26 abr 2024

Los datos se mueven muy fácilmente a través de las redes digitales. Hemos recorrido un largo camino desde el sistema de información en papel que duró desde la invención de la imprenta hasta finales del siglo XX.

La mayoría de las veces, pensamos que los datos digitales son algo bueno. Es muy fácil enviar nuestros expedientes o transcripciones de un sitio a otro.

Pero todos esos datos de libre circulación y fácil acceso tienen su lado negativo. Tus datos pueden utilizarse para entrenar la IA, te guste o no.

Si la IA utiliza sus datos, puede perder su intimidad personal o contribuir accidentalmente a la discriminación de otras personas. También puede sufrir el robo de aspectos de sus escritos u obras de arte originales.

Las personas que utilizan IA a menudo no se dan cuenta de que la IA generativa puede estar copiando partes de su trabajo de formas que nunca habían sido legales antes de la IA. Ahora es bien sabido que la IA ha tomado obras protegidas por derechos de autor para utilizarlas como "entrenamiento", es decir, para imitarlas.

Sigue leyendo para saber cómo aumentar la privacidad de tus datos. Hay medidas que puedes tomar para evitar que tus datos o tus contenidos se utilicen para entrenar IA.

¿Qué es la protección de datos?

La privacidad de los datos es la protección de su información personal frente al acceso, uso o manipulación no autorizados.

En nuestra era digital, la privacidad de los datos es complicada. Empresas, gobiernos y otras organizaciones recopilan, almacenan y analizan ingentes cantidades de datos personales.

Esas organizaciones no siempre invierten en proteger su privacidad. De hecho, algunas pueden querer ganar dinero con el uso de tus datos. La forma más novedosa que tienen las grandes tecnológicas de utilizar tus datos es entrenar a la IA con ellos.

La importancia de los datos personales

Los datos personales incluyen cualquier información que pueda utilizarse para identificar a una persona, como nombre, dirección, correo electrónico, número de teléfono, número de la seguridad social e información financiera.

Estos datos son valiosos para las organizaciones, ya que les ayudan a entender a sus clientes, orientar sus esfuerzos de marketing y mejorar sus productos y servicios.

 

una persona accede a datos personales en internet

Datos personales

Riesgos de las filtraciones de datos

Cuando los datos personales caen en manos equivocadas, pueden dar lugar a robos de identidad, fraudes financieros o daños a su reputación.

Las filtraciones de datos son cada vez más frecuentes, y millones de registros quedan expuestos cada año debido a la piratería informática, el malware y otras ciberamenazas.

Ahora que la IA está desarrollando enormes bases de datos de información extraída de los usuarios de las redes sociales o de otras plataformas de Internet, es crucial que entiendas por qué tus datos podrían acabar en un sistema de IA.

¿Quieres comparar que tus datos se utilicen para entrenar IA? Bueno, hay varias razones por las que no lo harías.

¿Por qué es importante la privacidad de los datos?

Proteger la privacidad de sus datos es crucial por varias razones:

Prevenir el robo de identidad y el fraude

El robo de identidad se produce cuando alguien utiliza su información personal sin su permiso para cometer fraude u otros delitos. Al proteger la privacidad de sus datos, puede reducir el riesgo de convertirse en víctima de un robo de identidad y el coste económico y emocional que puede suponer.

Mantener la autonomía personal

Sus datos personales le pertenecen y tiene derecho a controlar cómo se recogen, utilizan y comparten. Al proteger la privacidad de tus datos, puedes mantener tu autonomía personal y asegurarte de que tu información no se utiliza de forma negativa.

 

una mano brillante sostiene la balanza de la justicia

La IA puede tomar decisiones sesgadas

Evitar la discriminación con la IA

Los datos personales pueden utilizarse para tomar decisiones sobre las personas, como ofrecerles un trabajo, un préstamo o un seguro. Cada vez más, la IA toma este tipo de decisiones.

Si la IA utiliza estos datos injustamente, puede causar graves daños. El sesgo algorítmico se produce cuando a las personas se les niega atención médica u oportunidades por el color de su piel u otras características. Cuando prestas atención a la privacidad de tus datos, puedes ayudar a prevenir la discriminación basada en tus características personales.

Crear confianza

Cuando las personas sienten que sus datos personales están protegidos, es más probable que confíen en las organizaciones con las que interactúan. Esta confianza es esencial para establecer relaciones a largo plazo y fomentar un ecosistema digital saludable.

¿Cómo se entrena la IA?

Los sistemas de inteligencia artificial (IA) se entrenan utilizando grandes conjuntos de datos, que a menudo incluyen información personal. Este proceso permite a la IA aprender patrones, hacer predicciones y realizar tareas basándose en los datos con los que ha sido entrenada.

La importancia de los datos de calidad

La calidad de los datos utilizados para entrenar la IA es crucial para su rendimiento y precisión. Si los datos están sesgados o incompletos, pueden dar lugar a resultados erróneos o injustos. Por ejemplo, si un sistema de IA se entrena con datos predominantemente de un grupo demográfico, puede que no funcione bien para otros grupos.

El proceso de formación de la IA

Entrenar la IA implica alimentarla con grandes cantidades de datos y utilizar algoritmos para identificar patrones en ellos. Este proceso puede requerir mucho tiempo y recursos, así como potentes ordenadores y software especializado.

 

Cabeza brillante con engranajes que muestra el entrenamiento de la IA

Formación en IA

¿Cómo recopila datos la IA?

Los sistemas de IA recopilan datos de diversas fuentes, entre ellas:

Plataformas de medios sociales

Las plataformas de redes sociales como Facebook, Twitter e Instagram recopilan grandes cantidades de datos personales de sus usuarios, incluidos sus intereses, comportamientos y conexiones sociales. Estos datos pueden utilizarse para entrenar sistemas de IA que permitan predecir mejor el comportamiento humano.

Navegación y búsqueda en línea Historia

Los motores de búsqueda como Google y Bing recopilan datos sobre los sitios web que visita la gente y los términos de búsqueda que utilizan. Estos datos pueden utilizarse para entrenar sistemas de inteligencia artificial que ofrezcan resultados de búsqueda más relevantes y publicidad específica.

Aplicaciones y sensores para teléfonos inteligentes

Muchas aplicaciones para smartphones recopilan datos sobre el comportamiento del usuario, su ubicación y otros factores. La IA puede utilizar estos datos para predecir a dónde irás, cómo lo harás Viaje, y otros datos muy valiosos para los profesionales del marketing o para cualquiera que quiera seguirte.

 

Los datos suben a la nube brillante en un paisaje urbano abstracto

La IA recopila datos en línea

Registros públicos y bases de datos

Los organismos gubernamentales mantienen registros públicos y bases de datos que contienen su información personal, como registros de la propiedad, registros de votantes y registros judiciales. Los sistemas de IA pueden utilizar estos datos para detectar fraudes y evaluar riesgos.

Transacciones y compras

Cuando compras en Internet o en una tienda, a menudo se recopilan los datos de tus transacciones y se utilizan para entrenar sistemas de inteligencia artificial con el fin de predecir el comportamiento de los consumidores y detectar fraudes. Por eso a veces recibes alertas de fraude si utilizas una tarjeta de crédito en un lugar inusual o haces una compra grande.

Tipos de sistemas de IA

Existen varios tipos de sistemas de IA, cada uno con métodos de entrenamiento y requisitos de datos diferentes:

Aprendizaje supervisado

El aprendizaje supervisado entrena a un sistema de IA en conjuntos de datos etiquetados, en los que se proporciona la salida correcta para cada entrada. Esto permite al sistema aprender a hacer predicciones o clasificaciones basadas en los patrones que identifica en los datos.

Aprendizaje no supervisado

El aprendizaje no supervisado entrena a un sistema de IA con datos no etiquetados, en los que el sistema debe identificar patrones y relaciones por sí mismo. Puede utilizarse para tareas como agrupar puntos de datos similares o identificar anomalías.

Aprendizaje por refuerzo

El aprendizaje por refuerzo utiliza interacciones de ensayo y error dentro de un entorno para entrenar un sistema de IA. El sistema recibe recompensas o castigos en función de sus acciones y aprende a optimizar su comportamiento con el tiempo.

Aprendizaje profundo

El aprendizaje profundo entrena redes neuronales artificiales en grandes conjuntos de datos, lo que permite al sistema de IA aprender patrones y relaciones complejas en los datos.

Esta tecnología de aprendizaje profundo ha dado lugar a grandes avances en áreas como el reconocimiento de imágenes y del habla, el procesamiento del lenguaje natural y los vehículos autónomos.

 

imagen brillante del contorno de la cabeza con líneas que representan sinapsis

El aprendizaje profundo utiliza redes neuronales

Cómo impedir que tus datos personales se utilicen para entrenar IA

Para proteger la privacidad de tus datos y evitar que tu información personal se utilice para entrenar sistemas de IA, puedes tomar las siguientes medidas:

Lea atentamente las políticas de privacidad

Antes de compartir tus datos personales con cualquier organización, lee atentamente su política de privacidad y sus condiciones de servicio. Busca información sobre cómo se recopilarán, utilizarán y compartirán tus datos, y si tienes la opción de excluirte de determinados usos.

Utilizar la configuración de privacidad

La mayoría de las plataformas de redes sociales y servicios en línea ofrecen opciones de privacidad que te permiten controlar quién puede ver tu información y cómo puede utilizarse. Aprovecha estos ajustes para limitar la cantidad de datos personales que compartes públicamente. Al final de este artículo encontrarás consejos específicos.

Sea selectivo a la hora de compartir información personal

Sea prudente a la hora de compartir información personal sensible en Internet, como su número de la Seguridad Social, datos financieros o información médica. Comparte esta información solo cuando sea absolutamente necesario y con organizaciones de confianza.

Utilizar herramientas de protección de la intimidad

Existen diversas herramientas que pueden ayudarte a proteger la privacidad de tus datos, como las redes privadas virtuales (VPN), las aplicaciones de mensajería cifrada y los bloqueadores de anuncios. Estas herramientas pueden ayudar a evitar que tus datos sean recopilados y utilizados sin tu conocimiento o consentimiento.

 

Cyborg estudia un código binario brillante en una pared

Proteger los datos personales

Cómo evitar que el contenido o las imágenes de tu web se utilicen para entrenar IA

Ahora que la IA generativa, como ChatGPT, Bing y Claude 3, es tan común, hay un nivel completamente nuevo de cómo la IA puede tomar y utilizar tus datos. El problema no es sólo si la IA utiliza tus datos personales. La IA también puede tomar cosas que tú creas, como libros de instrucciones, escritos creativos u obras de arte que hayas realizado.

ChatGPT, por ejemplo, puede utilizar cualquier cosa que introduzcas en Introduzca como pregunta o recurso para obtener datos de entrenamiento adicionales. Así, si Introduzca introduce en la ventana de chat una redacción que escribió en la universidad para enseñar a ChatGPT su estilo de escritura, su redacción puede servir de base para la redacción de otra persona más adelante.

En algunos casos, la IA puede incluso utilizar el texto exacto de una obra existente para crear una obra supuestamente nueva. Así que, aunque las empresas de IA insistan en que sus productos son "nuevos", no se sorprenda si ve que su obra aparece con un disfraz muy delgado. Muchos escritores y artistas afirman que la IA repite sus propias obras.

Cuanto más raro sea su tema, más probable es que un sistema de IA pueda tomar sus palabras o imágenes exactas sin apenas cambios.

Hay opciones en varias plataformas que pretenden limitar si la IA puede utilizar tus datos o tus creaciones. Sólo hay una forma segura de mantener a la IA fuera de tus contenidos, y es mantener tus contenidos fuera de internet. Pero esto es muy difícil en el mundo actual, donde internet es el medio de comunicación o publicidad más popular.

 

Una mujer humana se asoma a una lente redonda rodeada de código binario

La IA ignora las leyes sobre derechos de autor

Cómo renunciar a la formación en IA

Tanto si quieres que tus datos personales estén fuera de los límites como si quieres que tus ideas y tu arte estén protegidos, hay algunas formas de pedir a las empresas que respeten tu confidencialidad y tu contenido.

Recuerde que no hay garantías contra la IA o el robo o uso indebido de datos. Pero aquí tienes algunas formas de elegir opciones más privadas.

Adobe

Adobe hace que sea fácil de mantener su trabajo de diseño en la nube, pero eso significa que Adobe también puede tener fácil acceso a su creatividad para su formación Sensei AI. Aquí te explicamos cómo limitar el acceso.

  1. Inicie sesión en su cuenta de Adobe.
  2. Vaya a la página Privacidad y datos personales.
  3. Desactive la opción "Análisis de contenido".
  4. Desactiva "Uso de aplicaciones de escritorio" para impedir el seguimiento.

Manzana

Para rechazar la recopilación de datos y el entrenamiento de IA en dispositivos Apple:

  1. Vaya a Configuración > Privacidad > Análisis y mejoras
  2. Desactivar "Compartir análisis del iPhone"
  3. Desactiva "Compartir iCloud Analytics".
  4. Desactivar "Compartir con desarrolladores de aplicaciones"

Google

Para inhabilitar la recopilación de datos en los servicios de Google:

  1. Visita myactivity.google.com
  2. Haga clic en "Controles de actividad".
  3. Desactiva "Web & App Activity".
  4. Elimine los datos existentes que no desee utilizar para el entrenamiento de la IA.

 

Logotipo de Google Gemini en el teléfono

Google Géminis

También puedes optar específicamente por no permitir que Google Gemini utilice tus conversaciones para la formación. Pero recuerda que no hay garantías de que lo que elijas proteja realmente el material que introduzcas en Gemini. Sólo tenemos la palabra de estas grandes empresas de que no utilizarán los datos. Históricamente, los ejecutivos motivados por los beneficios se saltan las normas.

  1. Abra Géminis en su navegador.
  2. Haz clic en Actividad y elige "Desactivar".

Grammarly

  1. Abra la Configuración de la cuenta.
  2. Haz clic en Configuración de datos.
  3. Desactive la mejora del producto y la formación.

Microsoft

Para excluirse de la recopilación de datos y de la formación en IA en los servicios de Microsoft:

  1. Accede a tu cuenta en account.microsoft.com
  2. Ir a privacy.microsoft.com
  3. Vaya a su panel de privacidad
  4. Seleccione "Gestionar mis datos de actividad".
  5. Borra los datos que no quieras utilizar para el entrenamiento de la IA
  6. Ajuste la configuración de privacidad en cada uno de sus dispositivos para limitar la recopilación de datos en el futuro.

OpenAI

Optar por no participar en la recopilación de datos y el entrenamiento de IA por parte de OpenAI:

  1. Envíe un correo electrónico a privacy@openai.com con el asunto "Opt out of data collection".
  2. Incluya su nombre y dirección de correo electrónico en el cuerpo del mensaje
  3. Solicitar que sus datos se excluyan de la formación en IA y se supriman si procede.

El logotipo de OpenAI parece enterrado

OpenAI ChatGPT

Si tienes una cuenta ChatGPT:

  1. Ir a Ajustes
  2. Ir a Controles de datos
  3. Desactivar ChatGPT Historia & Formación

Si no tiene una cuenta ChatGPT y sólo utiliza el navegador web

  1. Ve a Ajustes.
  2. Desmarca "Mejorar el modelo para todos".

ChatGPT también tiene un formulario que puedes enviar para eliminar tus imágenes de DALL-E. El proceso no es sencillo.

Slack

Slack puede utilizar sus mensajes para el entrenamiento de IA, y la única manera de optar por no participar es que su administrador envíe un correo electrónico a feedback@slack.com. Tu administrador tendrá que incluir la URL de tu organización e incluir en el asunto "Slack Global model opt-out request".

Sus propios sitios

Si tiene su propio sitio web, puede utilizar su archivo robots.txt para ajustar si la IA puede o no raspar su contenido.

Scraping es una palabra técnica para referirse a la recopilación de datos que no pertenecen al scraper. Significa tomar contenidos de Internet sin permiso (y sin compensarte) para que el scraper pueda utilizarlos.

La IA ya puede raspar contenidos a gran escala. Como se informó recientemente en el podcast Hard Fork, tanto Open AI como Google rasparon todo el texto de millones de vídeos de YouTube para entrenar a sus chatbots de IA generativa. Se trata de una acción que se habría considerado robo de contenidos según las normas de derechos de autor anteriores, sobre todo porque gran parte de ese material de YouTube estaba protegido por derechos de autor.

Lo que nos lleva a otro punto. Cuando tu contenido está alojado en una plataforma externa como YouTube, puede que haya mucho menos que puedas hacer para protegerlo. Muchos creadores de YouTube aún no se han dado cuenta de que sus contenidos han sido "scrapeados" y utilizados para crear nuevos contenidos para otras personas, lo que reporta beneficios a la empresa de IA pero ninguno al creador original.

Si alojas un sitio web en Squarespace, existe una guía de ayuda fácil de usar que te muestra cómo desactivar los "rastreadores de Inteligencia Artificial" para tu sitio web de Squarespace.

Manténgase alerta y no confíe en todas las promesas empresariales sobre sus datos

Tomando estas medidas y siendo proactivo en la protección de la privacidad de tus datos, puedes reducir la probabilidad de que tus datos se utilicen para entrenar sistemas de IA sin tu conocimiento o consentimiento.

Sin embargo, es importante reconocer que, en la era digital actual, es prácticamente imposible evitar por completo que sus datos se recopilen y utilicen de alguna manera. las mejores enfoque consiste en mantenerse informado, ser selectivo con lo que comparte y aprovechar las herramientas de privacidad y las opciones de seguridad que tiene a su disposición.

La IA trae nuevos riesgos a Internet. Sé consciente de las posibles consecuencias cuando interactúes con el mundo digital.

Asegúrese de que su proveedor de Internet es de confianza y está bien valorado

No existe un método infalible para proteger su información una vez que está en Internet. Pero puedes elegir un proveedor de Internet conocido por sus prácticas empresariales sólidas y fiables. Cuantas más empresas trabajes con las que hagan todo lo posible por proteger tus datos, más probabilidades tendrás de mantener tu privacidad.

Consulte nuestra información sobre proveedores de Internet para saber más.

 

 

 

 

Entradas relacionadas