¿Qué sucede cuando la inteligencia artificial comienza a navegar por el vasto océano de información en la web? Esta pregunta no es solo teórica. En la era de la IA generativa, donde los chatbots pueden ofrecer respuestas detalladas basadas en contenido extraído de Internet, el límite entre el uso justo y el plagio se vuelve difuso. Perplexity AI, una startup que combina un motor de búsqueda con un modelo de lenguaje avanzado, se encuentra en el ojo de la tormenta por su enfoque.
Perplexity AI: ¿Innovación o Infracción?
Perplexity AI se distingue de otros como ChatGPT de OpenAI y Claude de Anthropic al no entrenar sus propios modelos básicos. En cambio, utiliza modelos disponibles comercialmente para traducir la información recopilada de la web en respuestas detalladas. Sin embargo, esta metodología ha llevado a acusaciones de plagio y extracción de datos poco ética.
En junio, Forbes denunció a Perplexity por plagiar un artículo en su función Perplexity Pages, mientras Wired acusó a la startup de raspar ilícitamente su sitio web. ¿Está Perplexity cruzando la línea ética?
El Confuso Territorio del Protocolo de Exclusión de Robots y el Uso Justo
En el fondo de esta controversia se encuentran dos conceptos cruciales: el Protocolo de Exclusión de Robots y el uso justo en la legislación sobre derechos de autor.
- Protocolo de Exclusión de Robots: Este estándar permite a los sitios web indicar que no desean que los robots accedan a su contenido. Aunque Perplexity afirma respetar este protocolo, las acusaciones sugieren lo contrario.
- Uso Justo: Esta legislación permite el uso de material protegido por derechos de autor en ciertas circunstancias, como comentarios, críticas y reportajes. ¿Los resúmenes generados por Perplexity cumplen con estos criterios?
Experimentos y Acusaciones
Wired y el desarrollador Robb Knight llevaron a cabo experimentos para probar sus sospechas. Observaron que una dirección IP vinculada a Perplexity visitaba sus sitios web tras solicitar resúmenes de URL específicas. ¿Es esto una forma de scraping disfrazada? Wired sostiene que sí, argumentando que estas visitas y resúmenes constituyen una infracción.
La Defensa de Perplexity
El director de negocios de Perplexity, Dmitry Shevelenko, sostiene que resumir una URL no es lo mismo que rastrear. Según Shevelenko, la IP de Perplexity solo aparece cuando un usuario ingresa una URL en su consulta, lo que no cumple con la definición de rastreo.
«Simplemente estamos respondiendo a una solicitud directa y específica del usuario,» dijo Shevelenko. Sin embargo, para Wired y otros editores, esta distinción es insuficiente.
¿Plagio o Resumen?
Wired y Forbes también acusan a Perplexity de plagio. Wired argumenta que el chatbot de Perplexity reproduce oraciones exactas de sus artículos, lo que constituye plagio según las pautas del Instituto Poynter. Forbes informó que la función Perplexity Pages incluía contenido y diseños prácticamente idénticos a los originales de Forbes.
¿Es esto plagio o simplemente un resumen bajo el uso justo? La respuesta no es clara. Mark McKenna, profesor de Derecho en la UCLA, señala que los tribunales considerarían si los resúmenes usan muchas expresiones del artículo original y si la lectura del resumen podría sustituir la lectura del artículo completo.
Estrategias de Protección y el Futuro
Para protegerse, Perplexity está negociando acuerdos de reparto de ingresos publicitarios con editoriales. Estos acuerdos permitirían a los editores obtener una porción de los ingresos generados por los anuncios mostrados junto con las respuestas de Perplexity.
¿Es esta una solución sostenible? Si los sistemas de inteligencia artificial continúan reutilizando el contenido de los editores, estos podrían enfrentar dificultades para monetizar su trabajo, lo que a largo plazo podría reducir la cantidad de contenido disponible para extraer.
Conclusión: Un Futuro Incierto
La situación de Perplexity destaca los complejos desafíos éticos y legales en la era de la IA generativa. ¿Hasta dónde puede llegar la tecnología antes de cruzar la línea ética? Esta pregunta sigue siendo objeto de debate, y las respuestas tendrán un impacto profundo en el futuro del periodismo y la inteligencia artificial.
En Resumen:
- Perplexity AI combina un motor de búsqueda con un modelo de lenguaje avanzado para ofrecer respuestas detalladas.
- Acusaciones de Forbes y Wired sugieren que el enfoque de Perplexity podría ser poco ético.
- Conceptos clave: Protocolo de Exclusión de Robots y Uso Justo.
- Experimentos de Wired demostraron que Perplexity podría estar ignorando las normas de exclusión de robots.
- La defensa de Perplexity se basa en la distinción entre resumir y rastrear.
- Acusaciones de plagio ponen en duda la legalidad y la ética de los resúmenes generados por IA.
- Futuro incierto: Los acuerdos de reparto de ingresos podrían ser una solución temporal, pero los desafíos persisten.
Esta compleja historia nos recuerda que, en la era de la IA, las líneas entre innovación y ética son cada vez más difusas. ¿Qué opinas sobre el futuro de la inteligencia artificial y los derechos de autor? La conversación apenas comienza.