Actualidad
Al diablo con las visas.
Llegó anoche, sólo dos semanas más tarde de lo que la necesitaba para poder asistir a la reunión de la ESA - Sociedad Ecológica de América que celebra este año su centenario. Me perdí la oportunidad de presentar mi trabajo y escuchar los comentarios de la comunidad de ecólogos; y lo más importante, saber que es lo que otros ecólogos están haciendo. Una lástima. A principios de este verano también me perdí la Conferencia Internacional de Ciencias Computacionales Sociales y otra reunión en Estados Unidos. sobre la evaluación de la resiliencia en el Ártico. El año pasado también me perdí la Conferencia Europea de Sistemas Complejos, mi mamá se enfermó y tuve que viajar a casa para cuidarla. Por suerte mi mamá esta mejor ahora, pero con tantos eventos académicos interesantes a los que uno no puede asistir ya sea debido a las restricciones de visado, falta de fondos, o eventos desafortunados; es imprescindible encontrar alguna solución alternativa para enterarse de lo que está pasando.
Y esta es mi solución: explorar Twitter.
Twitter no es una fuente perfecta de información, pero al menos es gratis y nos da una idea sobra la conversación digital. Al final, los seres humanos son sensores de esa realidad que uno se está perdiendo y dejan rastros en el mundo digital de lo que encuentran interesante.
Twitter no es una fuente perfecta de datos porque esta sesgada: sólo envían tuits las personas con acceso a teléfonos inteligentes o conexión de Internet, además Twitter es utilizado principalmente por personas en determinados grupos de edad, y por lo tanto podría no ser una representación fiel de lo que está pasando en toda la comunidad (en este caso de ecólogos), y nunca se tiene certeza de que tan bien muestreados están los datos. De cualquier forma, es gratuito y no se necesita visado para jugar con los datos de Twitter, aunque existen algunas restricciones.
Durante ESA se le pidió a los asistentes no publicar tuits a menos de que los expositores dieran permiso al comienzo de sus charlas. A pesar de esta política de no tuits durante #ESA100 (que fue su hashtag oficial), me las arreglé para recuperar más de 18.000 tuits de 2589 usuarios de Twitter. Esto es enorme!! Sólo para poner en perspectiva estos números, el movimiento en Twitter de otras conferencias que he observado, sin esta política de no-tuits, es el siguiente:
- Conferencia Internacional de Ciencias de la Computación Social: #ICCSS2015, 2288 tuits de 570 usuarios.
- Conferencia de Ciencia de redes 2015: #NetSci15, >2000 tuits, ~550 usuarios (de los que he analizado 801 de 195 usuarios)
- Conferencia Europea de Sistemas Complejos: #ECCS14, 2330 tuits, 399 usuarios.
- EAT Foro Estocolmo: #EAT2015, 897 tuits, 560 usuarios (me perdí el primer día de datos)
- Conferencia Resiliencia 2014: #Resilience2014, 2042 tuits, 442 usuarios
- Semana Mundial del Agua 2014: #wwweek, 1599 tuits, 793 usuarios
Así que en comparación, #ESA100 no solo fue enorme, también estuvo llena de actividad virtual, y todo esto a pesar de su política de no-tuits. Y esta actividad en Twitter es bastante predecible, al menos en el tiempo. Uno esperaría una explosión de actividad en torno a las sesiones plenarias en las mañanas y las tardes, y mucho menos durante las noches y antes/después de la conferencia. Así es como se ve:
Como se puede ver en la figura de arriba, no tengo datos de los tuits enviados antes de la conferencia. Esa es una de las limitaciones de la API de Twitter, usted puede solicitar los tuits pero ellos deciden cuáles y de qué período de tiempo le entregan. Anteriormente (el año pasado) había una ventana de 4 días para buscar en el pasado. Ahora es permitido ir más lejos en el pasado y cosechar más datos, pero todavía no es perfecto. Y como yo sólo hago esto como pasatiempo, no estoy al corriente de los constantes cambios en los términos de uso de la API.
Como era de esperar, hay picos de actividad durante el día y valles durante la noche, en algunos días incluso se puede observar la pausa para el almuerzo entre dos picos de actividad. Es bueno que la gente interactue y deje el teléfono guardado de vez en cuando. Pero, ¿quiénes envían tuits? ¿con quien están hablando y sobre qué?
La siguiente figura muestra una red, cada nodo es un usuario de Twitter, un nodo se conecta con otro si el primero menciona al segundo en su tuit. Por lo tanto esta es una red dirigida, donde el 16% de los enlaces son recíprocos. El tamaño de los nodos depende del número de conexiones en la red. También se podría utilizar el número de seguidores en Twitter, pero ya que estoy interesado en la conversación y quiénes son los usuarios interesantes a los que les debo mantener un ojo durante la conferencia, y no en los usuarios más populares en Twitter, el número de conexiones en la red es un buen indicador de la calidad del contenido de los tuits.
Aunque no se observa en este gráfico, es importante resaltar que la importancia de los vínculos entre nodos varia dependiendo del número de veces que un usuario menciona a otro a través de diferentes tuits. De esta forma, algunos vínculos pueden ser más fuertes que otros. Sin embargo, aunque esta gráfica puede parecer muy llamativa no es muy informativa: pocas personas parecen tener un montón de enlaces, mientras que la mayoría de las personas tienen pocos enlaces. Esto puede deberse simplemente a que algunas personas son más activas en Twitter, o publican tuits sobre cosas más interesantes que vale la pena mencionar (retuitear), o puede ser que hay alguna otra dinámica que no se puede establecer a partir de los datos por sí solos; por ejemplo que la persona que esta publicando los tuits es un ecólogo muy famoso o que menciona el presidente Barak Obama, o las dos. De cualquier forma, es una buena idea extraer los nodos de los que todo el mundo está hablando, para así filtrar la información que la red en su conjunto está señalando como la más importante, en lugar de leer todos los +18000 tuits.
¿Quienes son? Poner los nombres en el gráfico no nos permitiría ver nada. Así que aquí está la lista de los mejores 50 usuarios de Twitter durante #ESA100, creada con base en el número de veces que alguien los menciona. El número que acompaña el nombre corresponde al número de enlaces que tienen en la red, es decir el número de personas que los mencionan.
1. PLOS 248
2. JacquelynGill 230
3. leafwarbler 217
4. srsupp 193
5. DrEmilySKlein 174
6. ESA_org 173
7. ethanwhite 164
8. SPBombaci 162
9. ucfagls 154
10. katteken 137
11. DJPMoore 136
12.openscience 134
13. matthewgburgess 126
14. skmorgane 123
15. jhpantel 123
16. annamgroves 121
17. commnatural 113
18. noamross 112
19. polesasunder 108
20. LeahAWasser 107
21. DrNitrogen 106
22. sjGoring 105
23. sesync 104
24.treebiology 102
25. algaebarnacle 102
26. tpoi 101
27. ElenaBennett 98
28. NEONInc 90
29. jonbkoch 90
30.MethodsEcolEvol 88
31. PLOSEcology 86
32. colindonihue 86
33. tewksjj 82
34. INNGEcologist 82
35. jessicablois 81
36. ESAOpenSci 81
37. JoshGalperin 79
38. elitabaldridge 78
39. cjlortie 78
40. GrunerDaniel 75
41. MorphoFun 74
42. JCSvenning 73
43. bjenquist 72
44. PLNReynolds 70
45. fluby 69
46. nceas 67
47. wildwonderweb 66
48. esanathist 66
49. RallidaeRule 64
50. davidjayharris 64
¿De qué estaban hablando?
Ya que ESA cumple sus 100 años de existencia, aquí les presento los 100 tuits más reenviados durante la conferencia:
[1] "Teóricos: no nos digan que no le tengamos miedo de sus ecuaciones. Yo no les tengo miedo. Expliquenlas bien, como yo explico mis métodos, y continúen #ESA100 "
[2] "Miren al presidente Obama deseándole a la Sociedad Ecológica de América un feliz cumpleaños 1OO en Vimeo #ESA100 https://t.co/nhyaYmkt7C"
[3] "#esa100 es una buena ocasión para anunciar que @uofa está buscando 5 nuevos profesionales en genomica de los ecosistemas | de lo global a los microbios http://t.co/OZAyoDyO86"
[4] "El primer expositor #ESA100 reconoce la contribución de ESA en el ambiente: el Presidente Obama. Estoy impresionado! http://t.co/oDSMNXYPg4"
[5] "conoce a alguien que este buscando hacer un doctorado en ecología? Totalmente financiado (!) en Wisconsin trabajando en murciélagos e insectos http://t.co/q3rGh9roZr #esa100"
[6] "#ESA100 amigos, por favor, lea y RT mi artículo sobre cómo enviar tuits durante conferencias científicas! http://t.co/fMhDWivy9c #SciComm "
[7] "Excelentes noticias desde la reunión de consejo de @ESA_org: todos los miembros de ESA tendrán acceso gratuito en línea a las revistas de ESA. #ESA100"
[8] "Una de las mejores cosas que se pueden hacer en las reuniones es reconocer a los estudiantes que tratan de captar su atención y presentarse. #ESA100 "
[9] "Tenure track en modelado ecológico con @JaneElith y nosotros en @qaecology https://t.co/44jCNxRBiZ #ESA100"
[10] "Es raro que solo se puedan enviar tuits de charlas en #ESA100 con permiso. Si no quieres que la gente hable de su trabajo no deberían presentarlo"
[11] "guía de recursos Scicomm para la eco-comunicación #ESA100 http://t.co/h6nEbjaq9S http://t.co/Xv5qe0HxIS"
[12] "Sobre que estábamos tuiteando en #ESA100? (H/T otra vez @fmic_ para tener el código sobre las estadísticas en Twitter http://t.co/SlyQHL0yDE) http://t.co/eWmUxQJDhP
[13] "Por supuesto, Terry Pratchett ya escribió todo lo que pienso acerca de la ciencia y la ciencia ficción, y mejor que yo #ESA100 http://t.co/fMmM04NpHM"
[14] "Algunas reflexiones sobre #SciComm en # ESA100: Compartiendo ciencia, historias y arte; y la confusión de @ESA_org sobre las redes sociales: http://t.co/7crijzElJ2 "
[15] "Esto es lo que los estudiantes ven: menos mujeres dando charlas. Imagínese igualdad de género para la ESA 2016. #ESA100 @ESA_org #WomenInSTEM http://t.co/irs3QmStKD "
[16] "Diapositivas de mi charla #ESA100 sobre la comparación de diferentes enfoques para predecir diversidad. http://t.co/LoHIxgbidc w/enlaces al código + beca "
[17] "Nuestro articulo de centenario de #ESA100 en Ecospehre: Cambio climático e interacciones entre microbios y plantas @ESA_org http://t.co/fTLU0xtTOL"
[18] "Top tuiteros en la reunión #ESA100 (H/T @fmic_ a código de estadísticas de Twitter http://t.co/SlyQHL0yDE) Buen trabajo, equipo! http://t.co/zOpkQO4PaS "
[19] "#ESA100 n El mundo es grande. Los científicos son relativamente pequeños. Colaboremos"
[20] "Oí por casualidad la conversación de un asistente a bronycon: Creo que estas son personas de ecología, hay un montón de camisas hawaianas. #ESA100 "
[21] "Primero pruebe su charla en un simulador como ColorOracle! http://t.co/PNhsJQsApv # esa100 https://t.co/aVlYUz1TED "
[22] "#ESA100 1.2 M publicaciones en ecología (o más). Un total de 40% capturado en 4 términos: interacciones, biodiversidad, cambio climático, y gradientes".
[23] "feliz #ESA100 y #BronyCon! Hasbro, DM si quieres hablar de marketing. #mylittlesturgeon #mylittlestudyspecies http://t.co/GhY4KD56yb "
[24] "Hay demasiadas conversaciones que no puedo entender, porque las figuras no son amigables con los daltónicos #ESA100"
[25] "Secretos para el éxito de las redes científicas: confianza, tiempo y jóvenes científicos. @e_seabloom @e_borer #ESA100 "
[26] "Hagamos de la ecología de campo algo más seguro para todos: vengan a @Drew_Lab y a mi taller gratuito el Martes: http://t.co/icSjpaQE06 #ESA100 Todos bienvenidos"
[27] "Nuestro Programa de Becas Postdoctorales está aceptando aplicaciones! Recepción de aplicaciones revisadas hasta el 26 de octubre: http://t.co/8EkdBzxZjX Attn: #ESA100
[28] "Sí, eso es @POTUS! RT @LPZ_UWI: Obama celebra el centenario de #ESA100 con nosotros! http://t.co/M1MMpbKolD "
[29] "Hola #ESA100 La @calacademy esta contratando nuevos científicos en biodiversidad! Un montón de ellos! Haga ciencia, cambie el mundo! http://t.co/F9DvM3e1Hp "
[30] "En nuestro blog, usted puede enviar su "semilla" de un buen Antropoceno: http://t.co/rIBLhUGGPF #ESA100"
[31] "Un mensaje sorpresa de cumpleaños para @ESA_org de @POTUS "La salud de nuestra nación depende de la salud de nuestro ambiente" #thanksobama #ESA100"
[32] "Ponentes: promuevan #openscience! No olviden decirle a su público si están de acuerdo con tuitear en vivo! #ESA100 "
[33] "#VirginiaTech esta contratando un ecólogo de corrientes de agua! Acérquese a hablar conmigo en #ESA100 si tiene preguntas: https://t.co/aNOXL7l2yN "
[34] "Estamos en busca de datos de series de tiempo para un estudio #biodiversity. ¿Tiene datos para compartir? http://t.co/6PfCHWZMNImaadornelasmioconnor #ESA100 "
[35] "Noticias de Investigación en #ESA100" El aumento en el crecimiento del abeto rojo esta asociado con la Ley de Aire Limpio " @atkinsjeff http://t.co/yDm3w8vxUa http://t.co/rb9HO0ih9u"
[36] "Una cosa queda clara en #esa100: El Antropoceno como idea, ha ganado"
[37] "El Dr.Erwin: El cambio es la dinámica observable del registro fósil - no hay evidencia empírica para el equilibrio. nnYes!! #ESA100 #esapl2 "
[38] "Pérdida: la depredación de los gatos: 2,4 mil millones de aves muertas por los gatos en los EE.UU. cada año, 70% por gatos salvajes #ESA100
[39] "Puede que solo necesitemos mejores (radicales realistas, detalladas) visiones de un futuro positivo. #GoodAnthropocene #ESA100 "
[40] "Dibujando sus notas en #ESA100 ideas para la expresión creativa de #ESASciComm @commnatural http://t.co/22kL1reSc7 http://t.co/kPYoVV74wu"
[41] "Cuando la ciencia no es suficiente: Comunicando el Consenso Científico sobre #ClimateChanges @amillingworth #scicomm #ESA100 http://t.co/eLDAzp6sr2"
[42] "Hola #ESA100, por favor denle favorito a este tuit si usted está interesado en encontrar una manera de convencer a la sociedad para dar una ayuda presupuestaria para apoyar @ESA_SEEDS."
[43] "utilizamos estadísticas para ocultar la inestabilidad de nuestros argumentos" http://t.co/R7BC2f1UMr #ESA100 #ecology #biology"
[44] "No estoy seguro de entender la política de no tuit en #ESA100. Quiero decir ¿por qué quiere eso? Usted ya está compartiendo su investigación con profesionales "
[45] "Los científicos tienen dificultades para hablar sobre la raza. También tenemos dificultades para escuchar. Estas son conversaciones incómodas pero vitales #ESA100"
[46] "Cambio en el programa de #ESA100: nuevos COS a las 1050AM sobre el impacto de las alarmas de incendio en las dinámicas de comunidades de ecólogos http://t.co/hPW60xD55K"
[47] "Hermosos datos, cuidadosamente procesados y presentados, a disposición de todos en múltiples formatos. Sin duda, este es el futuro. #ESA100 "
[48] "Fabricantes de diapositivas en #ESA100: permitanme recomendarles esta escala de colores para sus gráficos en el futuro: http://t.co/FoTnVldbGL"
[49] "Fuerte argumento para permitir Twitter en conferencias y posters. #ESA100 #gsa2015 https://t.co/9bxHXga6dJ"
[50] "Uno nunca sabe pronombres de alguien a menos que se los pregunte. Algunas personas en #ESA100 los escriben en sus escarapelas. Siempre vale la pena mirar"
[51] "Visite ahora! Reportaje Especial sobre Ecología Urbana: Ecología Urbana: http://t.co/IHEVetopyL #ESA100 #UrbanEcology "
[52] "¿Podrían los moderadores en #ESA100 preguntarle a los expositores si esta bien que su charla este en Twitter? Apuesto a que la mayoría están de acuerdo, pero no saben que se requiere la aprobación. @ESA_org "
[53] "Los grupos de gente diversa resuelven mejor los problemas. Beneficios de la diversidad en la ciencia aumenta a medida que los problemas se hacen más difíciles #esa100 @ESA_SEEDS "
[54] "¿Qué sucede cuando la alarma de fuego se enciende durante las charlas en el #ESA100 http://t.co/G1zjTLJEAA"
[55] "Mi opinión de #ESA100 hasta ahora:. La ecología es en realidad un conjunto disperso de silos disciplinarios que apenas se comunican"
[56] "Los ecólogos con grandes habilidades para procesamiento de datos catapultaran la ecología en sus próximos 100 años! #ESA100 #hackingecology "
[57] "Los códigos se están convirtiendo en algo crucial en #Ecology @MethodsEcolEvolApplications explican nuevos software, equipos y herramientas #ESA100 http://t.co/FWgSo232hX"
[58] "#ESA100: Estoy generando un conjunto de datos sobre “quien pregunta?” después de las charlas. ¿Quiere ayudar? Sólo tenga en cuenta el género del expositor y de quienes le preguntan"
[59] "@KathiJoJo " China por sí sola está activando una nueva planta de carbón cada 8 a 10 días "#ESA100 https://t.co/ywkc5WSi4r"
[60] "Cualquier persona puede tuitear sobre mi poster en #ESA100 esta disponible en @figshare y @github también. nhttps: //t.co/fwHlmI9o5y "
[61] "Diapositivas de mi charla #ESA100 están en @nceas y en @DataONEorg herramientas de procedencia en #rstats para reproducibilidad y #opendata https://t.co/vlsHXsT4YF"
[62] "Nueva entrada en el blog: Pensamientos sobre #SciComm, #openscience, compartir, y la confusión de las redes sociales en el #ESA100. http://t.co/7crijzElJ2 "
[63] "Echale un vistazo a los mejores momentos de mi charla sobre fijación de nitrógeno en los bosques tropicales secos #ESA100 destacada en @PLOSEcology! n https: //t.co/i7kU68NcD9 "
[64] "De la audiencia: cálculo es las matemáticas “erróneas”. Nos iría mejor enseñando estadística y probabilidad (y la informática) #ESA100 #HackingEcology "
[65] "Hasta ahora muy pocas charlas han dado permiso para tuitear. Me pregunto si de verdad no quieren compartir o si es que no está en su radar #ESA100 "
[66] "Haciendo investigación en ecosistemas? Echale un vistazo a nuestros métodos, modelos, herramientas y bases de datos: http://t.co/2ihCI5Db1R #ESA100 "
[67] "#ESA100 salve la autoestima de un postdoctorado, tuitee su charla."
[68] "@BarackObama ayuda a celebrar el centenario de @ESA_org! #ESA100 #POTUS http://t.co/gz0W91hujg "
[69] "Empezando una semana de cubrimiento especial #climatechange #ecology para #ESA100; revise el resumen en http://t.co/FNpye6kbhm http://t.co/ekg6oi4HNW "
[70] "En #ESA100 @jagephart aplica un marco de vulnerabilidad al cambio climático de #foodsecurity en @PLOSEcology por @atkinsj http://t.co/rT5Di6yliT"
[71] "El Instituto Gund en #Vermont busca 5 estudiantes de doctorado. Hacer un gran trabajo en la hermosa #BTV: http://t.co/KvXdx7jVoQ # ESA100 http://t.co/vU14Qy9MT5 "
[72] "La ciencia es inútil a menos que se comparta con los demás, sin embargo, los académicos incentivan a otros a centrarse sólo en revistas revisada por pares @JulieReynolds88 #ESA100"
[73] "Fascinante charla de inicio de Rachel Vannette (http://t.co/lWuzTXhE1c): efectos microbianos en las interacciones planta-polinizador #ESA100"
[74] "Otra razón para que las charlas en #ESA100 estén abiertas a Twitter: tenemos un público global que no puede asistir a la conferencia! https://t.co/8kVQXsC3fR "
[75] "La mejor recaudación de fondos en #ESA100 #secchidisk #frisbee para @ESA_SEEDS por @duffy_ma @Drew_Lab @ESAAquatic @limnojess! http://t.co/wttjyh9Lm6 "
[76] "Todos los materiales, diapositivas, fuentes, código en @github y bajo CC-BY #openscience #ESA100 #rstats https://t.co/ocffOZsKL5 https://t.co/eJSMR0VmdQ"
[77] "tuit o no tuit en las conferencias? Confusión en el #esa100 http://t.co/9PA66JBVTO @Drew_Lab @ewanbirney @_Jni_ta_wheeler @ESA_org"
[78] "Lenore Fahrig: " Todo hábitat tiene valor, no importa cuán pequeño ". Gran revisión muestra que la pérdida de hábitat y NO la fragmentación perjudica la biodiversidad # ESA100 "
[79] "Potente escuchar a Susan Harrison que nos dice su sitio de muestreo de 15 años fue consumido por los incendios forestales hace apenas 30 minutos. Salud por las nuevas direcciones # ESA100 "
[80] "#BrightSpots, semillas de una #GoodAnthropocene: Bolsillos de un futuro mejor que ya están en existencia hoy # ESA100 http://t.co/rIBLhUGGPF"
[81] "# ESA100, Pres David Inouye, Plenaria Científica durante el saludo de #POTUS, Whooa, la ESA y US Pres, no hay nada mejor! http://t.co/i1ThOuwkyS "
[82] "¿Pueden ustedes en #ESA100 ayudarme a difundir la información sobre #sciart? https://t.co/opvO8isK70 Gracias! http://t.co/gG5S8gO2Q7 "
[83] "¿Cómo educar a todos cuando no valoramos la divulgación y el trabajo por la justicia social? Cuando pretendemos que la meritocracia funciona? @RushHolt @ESA_org # ESA100 "
[84] "Lovejoy. El objetivo de calentamiento de 2 grados no fue elegido por su mérito ecológico; significa un mundo con o sin arrecifes tropicales e.g. #esa100 http://t.co/nQsHj8jbK9 "
[85] "El cambio climático da forma a la sequía / frecuencia de inundaciones y su gravedad @allingon en @PLOSBiology @PLOSONE y sesiones #ESA100 http://t.co/B3EqPAvWx0"
[86] "Nueva @PLOSEcology " Todos los ojos en los océanos: James Hansen & Sea Level Rise http://t.co/vIRFonX1Rb @sashajwright #ESA100 http://t.co/ZWmbW5OsSo "
[87] "Otra divertida animación de una base Am Nat clásica de la ecología, nada menos que en rima! http://t.co/H6dcb2WbXb # esa100 "
[88] ". @ ESA_org Otra buena manera de mantener secretos importantes es *no* incluirlas en presentaciones a grupos de extraños #ESA100"
[89] "El mejor consejo en Twitter hasta el momento: Cuando tuitea 2+ veces por charla, contesta a la primera para crear una cadena de tuits. Gracias @PlantTeaching! #ESA100 "
[90] "La gente BronyCon tienen etiquetas rojas, amarillas, y verdes en sus escarapelas. Esto indica lo dispuestos que están a hablar. Hablar con verde #ESA100"
[91] "La ecología desde los árboles hasta la roca madre: la influencia humana en la zona crítica de la tierra # ESA100 - Ecotone (blog) http://t.co/WFSnddb6un"
[92] "@colidonihue # ESA100 Entre los usuarios favoritos (entre usuarios que tuitearon 5+ veces, excluyendo retuits). http://t.co/otms4ndCix "
[93] "La ecología en un mundo cambiante: el video del centenario de #ESA100 http://t.co/ByaaYIhXlB"
[94] "combustibles de conservación descubrimiento ecológico, no simplemente viceversa dice Bill Fagan #ESA100"
[95] "Diapositivas de mi charla # ESA100 sobre " Hacking ecología: Facilitando la investigación intensiva en datos en ecología "http://t.co/TD5BZYy3f0"
[96] "Para aquellos interesados en investigación: un nuevo paquete de R denominado cati #ESA100 http://t.co/gVMwoKtReG"
[97] "@Drew_Lab " No teníamos un Tardis, teníamos una colección de museo! "Viaje atrás en el tiempo para mirar a la diversidad de peces en la bahía de Bootless. #ESA100 "
[98] "cuestiones de tiempo. Aprenda acerca de la ecología temporal y los ecosistemas en el # ESA100 jueves por la mañana | http://t.co/dLmN9ZWESR http://t.co/e7c8BiVgsi "
[99] ".@Polesasunder creo un paquete #rstats para analizar los datos de series de tiempo de la comunidad: codyn #HackingEcology # ESA100"
[100] "@ethanwhite sobre los cambios culturales necesarios para obtener más científicos creando herramientas de software:. #Train #Hire #Collaborate #Reward #esa100"
La búsqueda produce resultados ligeramente diferentes cuando se agregan los tuits que se han retuiteado previamente. En la lista entrarían tuits que no figuran arriba, como por ejemplo:
- "RT @ flypod2: Para todos aquellos que buscan un doctorado en ecología. Financiado en su totalidad (!) En Wisconsin para trabajar sobre murciélagos e insectos http://t.co/q3rGh9roZr ... "
- "PLNReynolds RT: 50 artículos notables en #Ecology, todos actualmente #OpenAccess! # ESA100 #ReadingList http://t.co/Y1WYsYdVKA http://t.co/O6KDr3v... "
Como puede ver, un montón de ofertas de empleo, algunas menciones del presidente Obama, y la agradable sorpresa de ver que yo no era el único haciendo análisis de Twitter :). El primer tuit fue retuiteado 92 veces y el último sólo 11. Uno de los temas que consiguió mas retuits fue sobre la política de no-tuits, por ejemplo en los tuits 6 y 10, que tuvieron 53 y 44 retuits respectivamente. ¿Entonces con base en esto, crees que la gente estaba contenta con la política de los tuits?
La lectura de los >18000 tuits para averiguarlo no es una lectura placentera, incluso si usted, como yo, no puede asistir a la conferencia. Para responder a esa pregunta se puede utilizar el ‘análisis de sentimientos’ del público, una técnica de análisis de datos (texto) que clasifica fragmentos de texto (tuits en este caso), por la presencia de palabras que han sido clasificadas previamente como comunes al expresar emociones positivas o negativas. El léxico marcado (~ 6800) fue desarrollado por Minqing Hu y Bing Liu, dos científicos informáticos de la Universidad de Illinois y Microsoft, respectivamente. Pueden descargar su léxico y aprender más acerca de su trabajo aquí.
La siguiente figura muestra los resultados del análisis de los sentimientos para el conjunto de datos de #ESA100. Si un tuit tiene un puntaje de cero, el contenido de la emoción es neutral, si la puntuación es positiva está dominado por palabras positivas y si el resultado es negativo lo contrario. El gráfico muestra que la distribución de las emociones, a partir del léxico de Hu y Liu, son sesgadas hacia el lado positivo.
Los 10 mejores tuits positivos son:
- Vengan a vernos en el stand 328. Juegue nuestro juego para ganar un premio emocionante y entrar en nuestro sorteo de $100 en libros! # ESA100
- ¡Guauu! Fue un placer absoluto conocer a @kwren88! #ESA100 se pone cada vez mejor!
- Súper emocionada de ver que #sketchyourscience sucedió de nuevo en el #ESA100! Excelente trabajo de la gente de #ESASciComm! (#WishIWasThere)
- Du está haciendo todo más fácil para nosotros al explicar claramente si los resultados coinciden con sus predicciones. #ESA100
- RT @srsupp: Scanga: Es necesario encontrar una fuerte red de apoyo. Un trabajo que sea compatible con la familia, una copia de seguridad en el hogar (y dinero pueden ayudar). #earlycareer # ESA…
- RT @JoshGalperin: @uedlab – Los ecologistas miran como funcionan las ciudades #citites, pero pueden trabajar con los diseñadores para hacer que las ciudades funcionen mejor. # ESA100 ...
- Jackson: el trabajo interdisciplinario es difícil! Toma tiempo y la actitud/aptitud correcta – funcionan pero es un gran reto # ESA100
- La canción de inicio de la charla de Sejin # ESA100 fue preciosa, con ayudas visuales vivas y claras. A #ESASciComm le encantaría hablar con Sejin sobre sus decisiones de diseño!
- MUCHAS GRACIAS a @aleafwarbler para los excelentes tuits en vivo desde #ESA100 – excelentes para aquellos que no pueden estar allí! (como yo :( …)
- @MCFitzpatrick: Los nichos realizados se superponen cada vez menos a medida que avanza en el tiempo. ¿Qué tan bien funciona esto y puede funcionar mejor? #ESA100
Y los 10 mas tuits negativos son:
- @k_a_christopher Budismo: el sufrimiento proviene de la codicia, el odio, y/o el engaño. Los problemas ecológicos a menudo tienen los mismos orígenes. # ESA100
- La comparación de las áreas con pastos marinos americanos vs. invasivo juncia arena asiático ... áreas invasoras no son más susceptibles a la erosión # ESA100
- Brown: el desarrollo sostenible es termodinámicamente insostenible. Un accidente catastrófico parece casi inevitable #ESA100 muy provocativa.
- Porque de todos los problemas ambientales? La codicia, el odio, y / o el engaño dice @ElBeeddha #ESA100
- #ESA100 poster 188: Alyssa Gehman # OdumSchool-Influencias sobre la infección por un parásito invasivo, 8: 30-10: 30 am Sala de exposiciones 8/14
- Los científicos tienen dificultades para hablar sobre la raza. También nos cuesta escuchar sobre el tema. Estas son conversaciones incómodas pero vitales #ESA100
- Jim Brown: riesgo de un colapso catastrófico de la tierra es >99,99%. No veo ninguna salida. Ya es hora de que los ecólogos se levanten. #ESA100
- Veo un problema con esta imagen: http://t.co/zMGVI42K1n pista: es el mismo problema que tuvo la plenaria de #ESA100 ...
- Perdemos estudiantes STEM de minorías después del segundo año univ. a un ritmo alarmante. ¿Qué estamos haciendo mal? Centrarse en los cursos de introducción #esa100 @ESA_SEEDS
- Nos disculpamos por la alarma contra incendios. El sistema central de rociadores del centro de conv. se activo; causa desconocida #ESA100
- RTLauraEllenDee: De acuerdo! "BonnieKeeler: Triste perderse el #ESA100 Shark Tank. Con la esperanza de que habrá tuits en vivo "
Como se puede ver (queridos organizadores de ESA) no hubo resentimientos en contra de la política, a pesar de que los tuits en ambos lados de la distribución señalan a las personas tristes por perder la conferencia y contentas al ver tanta actividad en twitter…. ehemmm solo por decir...
Otra técnica que he utilizado en mi trabajo para comprender grandes cantidades de datos no estructurados, tales como textos, es el análisis de temas. Y repito, no es muy práctico leer todos los tuits, pero por suerte hay métodos para simplificar los datos ruidosos y extraer un sentido más real. En el análisis de temas se puede encajar la probabilidad de que una palabra corresponda a un tema, mediante el uso de la distribución de frecuencias de las palabras a través de los documentos, así como la probabilidad de que un tema explique el contenido de un documento.
Una técnica común para hacerlo se llama Asignación Dirichlet latente (Latent Dirichlet Allocation). Para esto, primero limpié el conjunto de datos creando un corpus sin palabras de llamada de atención, puntuación, los hashtags de la conferencia (#ESA100, #ESA2015), los nombres de twitter de las personas mencionadas y los enlaces a otras páginas web. Eso me deja con palabras que con suerte capturan los temas de la conversación de twitter. Para captar mejor la variabilidad de las palabras usadas, también tengo que deshacerme de las palabras excesivamente populares y muy raras que no contribuyen mucho a diferenciar un tema de otro.
Aunque el algoritmo de “machine learning” hace su trabajo, no estoy completamente satisfecho con el resultado. Cada nube de palabras en la figura de arriba, resume las palabras más comunes de los 30 temas que caracterizan la conversación de los 2589 usuarios de Twitter. Cada palabra se escala de acuerdo a la frecuencia con que se encuentra en cada tema. El problema con los datos de Twitter y los temas modelo es que uno termina con más documentos que palabras en ellos. Una vez que el conjunto de datos está limpio muchos tuits tienen algunas palabras o ninguna en absoluto, por lo tanto, la matriz término-documento es demasiado dispersa. Una manera de resolver el problema sería cambiar la unidad de análisis, los documentos, desde los tuits individuales a todos los tuits escritos por un usuario, suponiendo que cada persona tiene un interés particular en la conferencia. Si hubiera asistido a la conferencia, en mi caso, probablemente buscaría conversaciones relacionadas con métodos para el estudio de cambios de régimen. Intrínsecamente cada asistente tiene intenciones e intereses reflejados en sus tuits. Pero este análisis probablemente quede para un próximo escrito en mi blog. Si quieren jugar con los datos de cada tema modelo, pueden mirar esta visualización interactiva.
Créditos:
Todo este trabajo fue realizado en el programa R con base en el trabajo realizado en otros blogs y en artículos científicos. Si esta interesado en este tipo de análisis, escríbame y le puede ayudar con algunas fuentes de referencia. Las librerías que use fueron:
- Jeff Gentry (2015). twitteR: R Based Twitter Client. R package version 1.1.9. http://CRAN.R-project.org/package=twitteR
- Jeff Gentry and Duncan Temple Lang (2015). ROAuth: R Interface For OAuth.R package version 0.9.6. http://CRAN.R-project.org/package=ROAuth
La lista completa de creditos se puede consultar AQUÍ.