Estudiantes de la Facultad de Ciencias de la Comunicación, de la Universidad Nacional de Córdoba, que integran el equipo de investigación “Pluralidad epistémica: creencias, saberes y prácticas en torno al bienestar”, dirigido por la Dra. Vanina Papalini, cuentan sus experiencias utilizando la técnica de web scraping.

La gran masa de datos que se está generando en la actualidad, trae como desafío la búsqueda de nuevas formas de abordar los procesos de recolección y tratamiento de la información. Las investigaciones en comunicación, en este caso, que se realizan en la FCC, no están ajenas a estos procesos. Conversamos con Brenda Diosquez y Ezequiel Llanos para conocer la experiencia usando el sistema de automatización de web scraping. El proyecto que integran tiene como objetivo dar cuenta de los nuevos paradigmas en torno al bienestar, para eso analizan notas periodísticas sobre el tema.
Para comenzar ¿en qué consiste la investigación “Pluralidad epistémica: creencias, saberes y prácticas en torno al bienestar” dirigida por la Dra. Vanina Papalini? ¿Cuál es la noción de bienestar que manejan?
Ezequiel: El objetivo general es identificar la existencia de los nuevos paradigmas en torno a la salud y el bienestar de la población, principalmente en la ciudad de Córdoba y alrededores, como el Valle de Paravachasca. Vamos identificando que otros paradigmas, que no son los biomédicos o de la biomedicina occidental, están teniendo otro grado de aceptación y relevancia. Por ejemplo, con el reiki, el yoga, la terapia de mindfulness, etc. El bienestar se entiende de una manera quizás más holística, no tan segmentada como lo puede comprender la medicina.
Brenda: El marco teórico detrás de la salud y el bienestar es bastante complejo, es un tema de especialidad para la directora del proyecto. Su tesis doctoral aborda el tema de la autoayuda, el New Age y, las terapias alternativas. A partir del concepto de bienestar, se abren un montón de aristas que tienen que ver con neoliberalismo, terapias alternativas y complementarias, por ejemplo, la muerte digna, el buen vivir y la salud mental. Todo esto se aborda desde la antropología de la salud y en esta primera etapa de generación del corpus estamos dando un enfoque comunicacional y por eso estamos usando noticias.
En su trabajo aplicaron la técnica del web scraping y la teoría fundamentada para sistematizar y analizar los discursos sobre bienestar en los medios digitales Infobae, Cadena 3, TN y La Voz. ¿Podrían contarnos por qué eligieron está metodología y en qué consiste?
B: El web scraping es una técnica que está muy vinculada al surgimiento de la Big Data, a la posibilidad de acceder a datos infinitos en simultáneo. Entonces, lo que busca es tratar de captar la mayor cantidad de información, pero generando filtros que puedan reducir esa información. Para la búsqueda en los medios nombrados usamos dos palabras claves : “salud” y “bienestar”. Nos aparecían notas de estado de bienestar, mucha publicidad de bienestar en ansiedad, bienestar infantil, ancianidad. Esto se debe a que algunos bots buscan en internet toda la información relacionada a esas palabras.
E: Elegimos esta herramienta porque nos permite realizar de manera sencilla ciencia de datos. Y dentro del web scraping existen diferentes interfaces que tienen múltiples aplicaciones, por ejemplo, una llamada Anaconda. La elegimos básicamente por su eficacia y rapidez para recolectar un montón de artículos que no podríamos hacer a mano. Imagínense, buscar 300 artículos a partir de un texto de Google nos llevaría muchísimo tiempo, y sumado a eso tendríamos que sistematizarla en Excel y después curarla. De esta forma pudimos recopilar de forma muy rápida aproximadamente 250 artículos por medio.
Además del web scraping también usaron otra herramienta ¿Qué potencialidad tiene la teoría fundamentada y qué lugar tuvo en esta investigación?
B: Después de eso hubo una segunda etapa de curaduría de las notas recopiladas, algunas por ejemplo hablaban del bienestar que genera tener mascotas o de la alimentación basada en plantas; pero otras sí eran sobre el “bienestar” en el sentido en el que nosotros estábamos pensando. A partir de la teoría fundamentada, todas estas categorías nos permiten empezar a entender en qué lugar se ubica este concepto de bienestar y cuántas miradas posibles puede tener.
En otras palabras, la teoría fundamentada nos ayuda a generar categorías a partir de esa búsqueda. Y nuestro objetivo final es llegar a la nueva teoría, todavía estamos en el proceso de generar esas categorías, así que aún no tenemos resultados muy concisos. Pero sí vemos en este relevamiento que hay mucha vinculación con la alimentación, la cuestión espiritual, entre otras.
¿Cuáles son las ventajas y desventajas de trabajar con la técnica de web scraping?
E: Considerando que cada vez hay más artículos en la red y es sumamente complejo realizar un proceso de investigación en el que se incluyen muchas entradas, usar este tipo de técnicas nos pareció una herramienta clave. Otra ventaja fue el curado de los datos obtenidos, es decir, que la información sea relevante para nuestra investigación.
A nivel desventaja, está la necesidad de si o si tener en el equipo alguien que sepa de programación. Si bien hay softwares que permiten hacer web scraping, nosotros lo hicimos con un administrador que utiliza un lenguaje especial y en eso tiene un montón de paquetes de código abierto; entonces obligatoriamente necesitas conocimientos de programación.
B: Hoy ir a la página de un medio y descargar un montón de notas a partir de lo que queremos investigar es un laburazo pero, con estas herramientas, reducimos el tiempo de búsqueda.
Otra desventaja es la cuestión ética, ya que los bots pueden entrar a cualquier parte de la web y sacar información. Puntualmente, en nuestro trabajo, esto no fue una dificultad. Algo que nos sucedió fue que el bot no podía acceder a algunas notas porque los medios tenían suscripción y aparecian publicidades que dificultaban su recolección.
¿Nos podés contar cuáles son los principales resultados en esta etapa de la investigación?
B: A grandes rasgos y de forma muy exploratoria con el curado de información que venimos haciendo, podemos decir que cuando los medios hablan de salud y bienestar lo hacen por fuera de lo biomédico y abierto a significados que no tienen tanto que ver con la ciencia. Y la gente, también se está inclinando por esos campos no científicos. Concretamente, lo que encontramos en los medios es que hay una relación muy grande entre bienestar y felicidad.
El concepto de bienestar está vinculado a nuevas prácticas, nuevas creencias y nuevas formas de abordar y de mirarnos a nosotros mismos, nuestros cuerpos y nuestra espiritualidad. Por un lado, el discurso que promueven las grandes universidades de Estados Unidos sostienen un alto nivel de legitimidad. Y por el otro, el concepto de bienestar empieza a jugar dentro del mercado, esto lo podemos ver al encontrar mucha publicidad de, por ejemplo, lugares de spa. Creo que los resultados van a ir más por ese lado.