Transcript for:
Detección de Bots en Redes Sociales

qué tal amigos vamos a luego vamos aquí en esta ciencia de camino hoy vamos un poquito más tarde porque estuvo un poquito ocupado en otros asuntos administrativos pero igual este bueno hoy quiero platicarles un poquito de ayer estuve en una conferencia en una conferencia interesante que hablaba sobre lo que es la detección de bots ahorita tan de moda para cualquier cosa se utilizan desde un punto de vista entre comillas bueno un poco un punto de vista malo depende de quién a quien quieras promocionar y de qué forma entonces realmente los bots se utilizan de muchas muchas formas no es nada nuevo los bots ya se utilizaban en otros aspectos no se utilizaban éste pudiera decirse pues de manera telefónica no incluso se siguen utilizando esos marcadores automáticos pero bueno ahora el enfoque es ligeramente distinto en el sentido de que pues ahora se utilizan sobre todo en las redes sociales en las redes sociales si queremos magnífico pues si hacer más grande algún evento o alguna persona algún suceso los utilizamos precisamente a los a los votos pero ahorita ayer que estaba en esa conferencia veía la posibilidad es debe detectar a los bots de manera automática no tener a una persona allí detectando o diciendo esto esto es un bot o marcando como este ilegales algunos de los por ejemplo tweets específicamente de detección de bots en twitter donde sabemos que acá hay granjas los robots que se utilizan para este tipo de fines entonces se explicaba todo este proceso de cómo es la detección automática obviamente utilizando algoritmos de inteligencia artificial en esencia los algoritmos de inteligencia artificial los podemos dividir en dos clases de manera muy sencilla muy básica supervisados y no supervisados y bueno dentro de éstos habrá algoritmos de clasificación y otros de regresión en esencia bueno puedes hacer una clasificación muy básica y aquí lo que queremos es hacer lo que se quería hacer en esta conferencia era explicar como hacer esta clasificación de decir este tuit iniesta persona para esto entonces utilizan se hizo la propuesta de varios algoritmos supervisados y semi supervisados bueno medianamente supervisados es un enfoque realmente este raro en el sentido de que por ejemplo si es clasificación en este caso nosotros sería súper este ejemplos positivos y ejemplos negativos o sea son votos o no es un bot y el que es este semi supervisado nada más tenemos una sola clase opción nada más conocemos a los que son bots por ejemplo y todo lo demás vamos a asumir que no son bots sin embargo es interesante que no es un problema tan trivial o sea finalmente el algoritmo de inteligencia artificial si bien si podía diferenciar algunas clases en su mayoría aunque realmente hay programas muy buenos que prácticamente identifican al 99% de los bots por increíble que parezca no es tan trivial porque porque no todos los votos son iguales en qué sentido a bueno hay bots que reproducen los textos tal cual así como los programas así los empiezan a a twittear pero también hay este bots y modifican los textos utilizando diferentes herramientas de procesamiento de lenguaje natural se llama básicamente modificar estos textos para que tengan el mismo sentido entonces no es tan sencillo no es tan sencillo identificar cuándo es un voto y cuando no dependemos de más características no solamente de las características del tuit pues ya no nada más de que sea un texto repetitivo que encontremos esa misma entrada en muchísimos usuarios bueno ese sería un indicativo muy claro verdad de que eso es un mensaje promocionado eso es un mensaje que se quiere posicionar pero no todo es así con estos modificadores del lenguaje natural podemos modificar los clics de tal forma que no se vean iguales pero conserven el mensaje cosa que tampoco es trivial pero se puede hacer entonces la propuesta que se hizo de los del software que existe realmente para este tipo de en detección de bots pues se hace con muchas características de hecho el ayuno que es este se llama boot good good start o algo así les dejo el nombre por ahí se los pongo la descripción del vídeo que realmente lo hace de manera eficiente es comercial y todo por utiliza más de 1200 características por cada sujeto que se quiere evaluar en el sentido de saber si es un voto entre ellos pues obviamente entra la fotografía que no sea una fotografía descargado que encontremos con miles de d de reflexiones en internet entra la biografía las biografías también pueden ser repetitivas también pueden ser la misma geografía está en los usuarios lo cual quiere ser un indicador de que eso es un bot el cultivo de palabras también los bots tienen cierto el juego de palabras que sin lugar a dudas son repetitivos en tal compra por lo tanto también se hace un análisis estético del lenguaje etc realmente es un programa que obtiene 1200 características desde el tiempo que se conecta cuánto tiempo hay entre kuyt y kuyt este la aparición de tuits similares en un montón de cosas pero lograr prácticamente identificar al cien por cien crecer el 99 puntos algo por increíble que parezca como lo decía 58 por ciento de los bots son identificables a través de este software y al final bueno pues tú inter también los utiliza para identificar estas cuentas falsas etc qué algoritmo se utiliza bueno pues utiliza los algoritmos supervisados esto es nosotros bueno en desarrollo le dio ejemplos de sabes que todos estos tweets son de un bot este comportamiento es de un bot aprende y lleva ejemplos de todos estos clips son personas reales existen es un comportamiento normal entonces así en el informativo ejemplos de estos dos para los subclases de los bots que son el verdadero problema que son los que modifican el texto que son los que tienen diferentes horarios dependiendo de las granjas de bots bueno se les considera subclases de la clase en este bote y por eso no entra en juego el algoritmo semi supervisado no puede ser aplicado porque porque hay nada más y estaremos enseñando una clase que en esencia podría ser el usuario normal no el usuario real este es éste y le damos ejemplo de un usuario normal pero tiene demasiada variante no sea variaría demasiado el contexto por lo tanto cada utiliza este tipo de enfoques y se utilizan los enfoques de clasificación supervisada si hay de grandes enfoques e incluso no supervisados no se les da ejemplos pero el mejor ejemplo el mejor programa es sin duda él el programa este que les mencionaba les debo el nombre pero es un ejemplo supervisado donde se les dio ejemplos de bots ejemplos de los diferentes tipos de bots y ejemplos de personas reales así que básicamente la detección en un resumen muy muy genérico pues la detección de bots en twitter se hace con un algoritmo de inteligencia artificial supervisado se le enseño ejemplos de bots y ejemplos de scripts de personas reales y perfiles porque entran en juego y con eso se obtiene un desarrollo muy interesante para la detección automática de fotos así que si alguna vez se habían preguntado cómo es posible detectar los bots o si es posible detectar los bots de manera automática si es posible depende de muchísimos factores también porque incluso el lenguaje es importante no es lo mismo detectar un bote en inglés que uno en español por los modismos por la estructura gramatical etcétera pero que se puede se puede detectar este tipo de bots obviamente no todos son peligrosos más allá de de estar haciendo tweets bueno hay unos que hacen tweets con la intención de poner en la tendencia cosas particulares que puede ser lo que es peligroso hay otros bots que simplemente retuitean no pasa nada pero si esa es la forma en que podemos nosotros detectar a los bots de twitter eso es cómo se hace y realmente puede aprender a de lo que estamos haciendo con la aplicación que le podemos dar a esta detección automática de votos y bueno ya he llegado como siempre es un gusto platicarles de manera muy rápida algún tema por ahí me dejaron ya por primera vez en youtube unos temas que quieren que platiqué por aquí seguramente les estaré platicando en estos días de estos otros temas y pues como siempre yo nos veo en el siguiente vídeo espero les siga gustando estas pequeñas cápsulas de pláticas y nos veríamos en la siguiente emisión saludos [Música] hola