Otros minutos de fama (Entrevista en IGC)

Lo normal es que el entrevistado dude en las respuestas…pero en este caso la entrevistadora dudaba en las preguntas (todo muy amateur :))

 

Un paseo por Internet en una tarde de domingo

  Favorville: Supongo que inspirada en la palícula “Cadena de Favores” o algo ásí. Se trata de que la gente publique favores (”se necesita” o “se ofrece”). Es una iniciativa loable, pero dudo que tenga demasiado éxito (lo que se regala por nada, normalmente no vale mucho…y el que necesita un favor y no lo encuentra en su círculo de amigos, difícilmente lo encontrará en un desconocido).

 

 StandPoint: Un lugar donde exponer tus opiniones y ver qué opina el resto del mundo. Está bien para pasar el rato leyendo cómo se justifican algunas opiniones (y por supuesto, para el debate). Lo malo es que es difícil argumentar algo si el inglés no es tu idioma. Por ejemplo, en “God Exists“, hay un argumento que dice algo así: “Present time events only occur when a finite period of time preceeds the action”..para acabar diciendo que el Universo tuvo un principio…y que por lo tanto el tiempo no es infinito. La demostración presupone lo demostrado (una falacia típica)…pero claro ¿quien es el guapo que lo explica en inglés?

 

YesNoMayB: Un nuevo modo de buscar ligues. El tema de “contactos” en internet da bastante pena en general (hasta ahora las aproximaciones al tema eran puramente geográficas o por edades y sexo…) Hay bastantes alternativas curiosas en este campo, pero esta es sin duda una de las que más me gustan. Me pregunto si utilizarán redes neuronales o algo así para aprender de tus gustos? (tipo pandora)

 

 Turn: Dentro de pocoGoogle se meterá de lleno en el negocio del CPA (cost per adquisition), lo que supone un modelo publicitario muy atractivo para muchas empresas (sólo pagas por las visitas que culminan con un éxito). De momento estos parecen ser uno de los que mejor lo hacen y de forma bastante simple.

Animador vs Animación II

 

Una de las cosas más originales y divertidas que he visto.

 

Supermercado 2.0

Supongo que se sentaron una tarde y dijeron: ¿Como podemos crear contenido viral para geeks de la Web 2.0?

Y la mejor forma: riéndose se ellos!

El video es buenísimo…pero solo lo entenderán los que estén en todo este rollo de la Web 2.0.

glumbert.com - Supermarket 2.0

Mi ADN personal

Una curiosa aplicacion on-line nos permite hacer nuestro propio ADN personal (un resumen muy esquemático de nuestra personalidad).

El test está muy bien pensado y ejecutado. Los resultados son MUY certeros y la forma de plantear el cuestionario hace que rellenarlo sea divertido.

Al final he quedado como “Inventor benevolente“. Los que me conozcan, que juzguen :)

 

También se puede pedir a otros que hagan informes sobre nosotros…Por ejemplo, cualquiera puede opinar sobre mi aqui.

Google Website Optimizer

Por fin Google me muestra los resultados de mis experimentos!

Hace unos meses Google lanzó “Google Website Optimizer“, una herramienta que permite hacer experimentos multivariable sobre páginas web (típicamente, las páginas de aterrizaje que son la puerta de entrada a la Web).

La herramienta te permite hacer experimentos bastante “científicos” con nuestra web de la siguiente forma:

  1. Se definen secciones variables dentro de la Web (un banner, un título, una imagen, un pedazo de texto, etc.)
  2. Se crean variaciones para cada una de estas secciones (por ejemplo, 2 banners distintos y 3 botones diferentes para ir a un sitio)
  3. Se define lo que consideramos un “éxito” (por ejemplo, que se realice la compra o que se envie un formulario, etc.)
  4. Google va presentando aleatoriamente todas las combinaciones a los usuarios que entran en la Web…y mide qué combinaciones generan más éxitos.

De hecho es lo más parecido a un análisis clínico con diferentes fármacos, administrados a grupos aleatorios y de forma que ni el que da el medicamento ni el paciente son consciente de lo que toman (doble ciego).

Al final de un periodo Google ofrece los resultados del experimento, dándonos la combinación que mejor funciona. Cualquiera con 2 dedos de frente se da cuenta de las posibilidades que esto da: nos permite experimentar con los “gustos” de nuestros consumidores, adquiriendo dia a dia mayor conocimiento de su imaginario, de su vocabulario, de sus gustos, etc…(construimos un perfil del consumidor/usuario que nos puede servir en otros medios de comunicación!). El potencial es ENORME.

El caso es que hace bastante tiempo inicié una experimento con la Web de mis padres (www.multiserviciosvalles.com). Estos fueron los parámetrosdel experimento:

  1. Creé 3 secciones en la Home. La primera afecta al título, con 2 posibilidades (”¿Podemos Ayudarle?”, enlazando al formulario de contacto, o “Visite nuestro catálogo de maquinaria” enlazando al catálogo de productos).
  2. La segunda sección afecta a la oferta de la cabecera. La primera oferta era de sillas, la segunda de hornos. Y la tercera sección afectaba a la imagen de la derecha: la primera era un conjunto de maquinas que enlazaba al catalogo.
  3. La tercera una tarjeta con los datos de contacto enlazando al formulario. 

Supuse que la sección de ofertas no afectaría sensiblemente al resultado (solo interesaria a los que quisieran ESE articulo), pero lo dejé para ver si los resultados del experimentos eran coherentes con esta hipótesis.

Los resultados del experimento han salido hoy, y son los siguientes (clic para ampliar):

 

 

En esta (arriba) se puede observar claramente que hay una combinación ganadora que funciona mucho mejor que la original, y bastante mejor que su sucesora (combinación 3). La pregunta es ¿Cual de las tres secciones variables es la que incide en el éxito? En este caso las secciones no tenian una relacion semántica coherente…así que es previsible que alguna sección impacte más que las otras.

La segunda captura (abajo) intenta responder a esta pregunta, pero poco se saca en claro. Google ya me ha advertido de que no tiene datos suficientes para considerar estos datos como definitivos (son preliminares). Sin embargo veo algo que me sorprende…la oferta de hornos atrae a más gente!

 

Según los resultados del estudio, la Home que mejor funcionaría es una con un título que invite al catálogo, la foto de la maquinaria y una oferta de hornos (versión definitiva abajo)

Lo cierto es que el simple hecho de realizar estas pruebas ha hecho que mi ratio de conversión haya subido (aunque debo confesar que el negocio de mis padres es estacional y esto ha podido afectar a las conversiones)

En todo caso es apasionante ver las posibilidades que da esto. Creo que podría montar una empresa basada únicamente en optimizar la conversión de la Web y dar conocimiento sobre el perfil de usuario :) (quizás mi Idea 0006!?)

Mis 15 minutos de Fama

Según Andy Warhol, ya he tenido mi ración de fama en esta vida. Ayer me llamaron para que participase en un programa de radio (La Malla, de COM Radio) y la verdad es que fue una experiencia agradable.

Se trataba de explicar un poco las charlas que habíamos dado en la Semana de la Universidad y Empresa de la Universidad de Barcelona (donde dí una charla sobre Internet como herramienta de Internacionalización el pasado lunes)

Mi intervención no duró más de 10 minutos en total, y la verdad es que es muy difícil no quedar como idiota cuando la locutora habla de un modo tan profesionalmente natural, pero por ahora los comentarios de mis compañeros de trabajo son positivos.

Cosas interesantes entre bastidores: El gerente de FNAC es un tio simpático, y el responsable de Formación de Caixa Sabadell se mostró realmente cercano. Comentamos algunas cosas de empresa, sin ánimo de vender ni comprar nada, sólo como amantes de la tecnología.

Y un secretillo: las entrevistas que se escuchan fueron grabadas el dia anterior, aunque todo se escuche como muy “dinámico” (la magia de la radio)

Y finalmente, he aquí mis minutos de fama (empieza a reproducir automáticamente, cuidado con los altavoces)

(Por cierto…además de PodCast, estaria bien que COMRadio facilitase un widget para poner estas cosas en el Blog de cada uno…)

Lo que le falta a Linkara

Hace tiempo conocí a una chica metida en muchas cosas (gente realmente interesante) y una de esas cosas era Linkara.com

Creé una cuenta en linkara hace muuuucho tiempo (tanto que mi identificador era numérico!) y luego me olvidé. Sencillamente no encontré una proposición de valor suficientemente clara en las aplicaciones de “social networking” que empezaban sus andaduras en aquel entonces (neurona, linkara, econozco, orkut, etc.)

Lo cierto es que el tiempo pasa y que en Internet nadie queda excento de evolucionar o desaparecer, y en este caso Linkara ha evolucionado. Ha dotado de SEMÁNTICA su red, de tal forma que ya no es una red neutral de contactos (gente que conoce a gente) sino de personas que se unen temporalmente a través de objetos culturales y de ocio (películas, libros, música, restaurantes…)

Linkara ha encontrado una proposición de valor para aquellos que quieren agregarse a su red: multitud de contenidos útiles (críticas de películas por ejemplo) y que al mismo tiempo permiten situarse rápidamente en la red actual (”arrimándose” a los mismos gustos que otros).

Ahora ya tengo un incentivo para unirme a la red y una forma rápida de encontrar mi lugar en ella…pero lo que me gusta aún más: las relaciones no son permanentes…sino que fluctuan. Establezco relaciones permanentes con mis amistades (las que marco como tal), pero también relaciones temporales con todos aquellos que escriben sobre la misma película. Las amistades se fraguan a través de estas relaciones efímeras de un modo muy natural (si coincido varias veces en las mismas películas y libros con las mismas personas es probable que acabemos siendo amigos).

En este modelo los objetos culturales funcionan del mismo modo que la “cercania” o la “coincidencia” en el mundo real. Uno se hace amigo de quien tiene cerca (por trabajo, vecindad, etc.), pero eso en Internet no existe…utilizar la cultura (uno de los rasgos distintivos de la personalidad) para suplantar este hecho es sin duda un acierto.

Veo que ahora Linkara lucha por no convertirse en un modelo de interacción conocido hace tiempo: el de la comunidad virtual (tipo foro). El riesgo de convertirse en una comunidad virtual temática (comunidad de cine, de libros, etc.) y abandonar completamente el modelo de red social es bastante evidente, sobretodo porque la diferencia es sutil (pero importante).

En un foro lo que importa es el contenido. Todo está dispuesto para favorecer la discusión y generar contenidos de calidad que perduren y sirvan como base de conocimiento para un tema concreto. En una red social lo que se busca es maximizar el valor de la red (definido en potencia por el numero de nodos y relaciones) de tal forma que la “perdida derivada de no agregarse a la red cada vez sea mayor”. Es decir…en este caso el contenido es sólo una herramienta para conseguir una red cada vez más grande (y valiosa) a la que toda persona quiera (y pueda) sumarse para no perder “oportunidades”.

En este sentido, echo de menos 3 cosas en Linkara (que por otra parte la alejarían del modelo de foro clasico):

  1. Integración con la Blogosfera. Lo único que veo es un botón que puedo añadir en mi blog…sin embargo mi blog sigue sin hablar con Linkara. Existen multitud de posibilidades en este sentido: integración de contenidos (¿porqué escribir las cosas 2 veces?), exportación a FOAF de mis amistades (¿os imaginais un widget para tu blog que muestre tu red de amistades?), etiquetado inteligente (por ejemplo, ofrecer las calificaciones de las películas a través de SOAP o REST para integrar en multitud de cosas), etc.
  2. API: Como puede ser que no tenga una API? Si voy a meter aqui mi red de amistades, quiero poder sacarla y utilizarla en múltiples lugares…podría combinarla con Google Maps para localizar a mis amistades en el mapa, o con Flickr para tener noticias cada vez que algun amigo publica nuevas fotos a través de su RSS…Las cosas, abiertas por favor
  3. Metadatos: La gente genera información con solo moverse…esa información es muy valiosa, como han demostrado muchas iniciativas de la llamada Web 2.0 Flickr por ejemplo publica la lista de cámaras más populares (a partir de la matainformación de las fotos digitales), y Technorati ofrece magníficos informes de la actividad en la blogosfera. La cantidad de información que se puede sacar de Linkara es enorme y seria interesante (un anzuelo para los medios :)). Imaginad por ejemplo algo tan sencillo como “a la gente que le gustó esta peli, le gustó esta otra y este libro…

 

Bueno…evidentemente estas se me ocurrieron en 10 minutos (el tiempo que tengo para escribir esto), pero más allá de “visiones futuristas”, creo que están haciendo un buen trabajo.

Chavez, hombre del año

Acabo de leer esto, y me parece increible:

Time elige como ‘personaje del año’ a todos los usuarios de Internet al descubrir que los votos de los lectores seleccionaron a Chávez

Y para taparlo ponen esto:

43298_3.jpg

Es el colmo de la desfachatez. Vamos a repasar la lista de imfamias:

  1. Le dan voz a los internautas para que elijan al hombre del año. Los internautas no eligen lo que ellos querían, así que ignoran su opinión.
  2. En lugar de tener en cuenta la opinion de los internautas, eligen como personaje del año a la figura del internauta como decisor!!! Es como rendir culto a dios pintando figuras paganas en la iglesia!
  3. Y por último, nuestros medios de comunicación (Televisivos) sólo publican PARTE de la historia. Todos destacan “lo visionarios” que son los de la revista TIME al reconocer la importancia de la opinión de la gente y de Internet…pero ni una palabra de Chavez.

Y como me he enterado de esto? Pues por el mail de una colega de trabajo…es decir, a través de redes de contactos, mails reenviados, blogs y fuentes de información colaborativas (estuvo en digg).

Lo cierto que es que TIME tiene razón con la portada…pero menudo cinismo en las formas.

Mi primer análisis de redes: Clusters de Búsqueda en AOL

Bueno…al final lo hice. No tengo la capacidad de proceso necesaria para hacer un análisis de los milllones de registros que todos estos ficheros contienen, pero si de un pequeño extracto.

He seleccionado los primeros 10.000 registros del primer fichero (supongo que menos de un 1% del total) y ha aplicado las ideas del post anterior. Para ello he cargado el primer fichero en ACCESS (no tenía ganas de instalarme un MySQL en local ni de andar subiendo cosas a otro servidor). Allí he manipulado un poco los datos con sentencias SQL hasta conseguir las relaciones entre usuarios a partir de sus búsquedas.

Access tiene la capacidad de hacer tablas dinámicas, algo muy útil para hacer la matriz de conexiones con pesos incluidos (esto último me costó un poco, pero lo solucioné añadiendo un simple contador a la consulta). El resultado de estas consultas lo pasé a Excel con el objetivo de darle el formato necesario para meterlo en NetDraw (una aplicación para la representación gráfica de redes, con algunas herramientas de análisis)

Después de algunas pruebas para pasar la información al formato correcto (un fichero pajek .net) pude abrirlo con NetDraw y empezar a jugar. Los atributos de cada nodo podrían ser la propia Query o la fehca de búsqueda, pero ninguno de los dos me daban información analizable, así que me concentré en buscar subgrupos (clusters) con las diferentes herramientas analíticas que ofrece la aplicación.

Aplicando una disposición de elementos con el algoritmo “Spring embedding” y de colorear los nodos en función de su “K-core” queda un gráfico bastante bonito con los subgrupos resultantes.

Red AOL.jpg

Los colores reflejan los subgrupos que pueden distinguirse en esta mini-red (recordemos que sólo se trata de un 1% de la red total).

Siguiendo con el experimento, y de acuerdo con el proceder “científico”, hay que comprobar si la hipótesis inicial es correcta. Mi teoría inicial era esta:

La gracia de este plantemiento es que no se centra en la observación subjetiva de los temas (como hace Slate), y es posible que los temas no sean homogéneos. Podríamos observar que los aficionados al humor político lo son también a buscar información sobre sus conocidos. Sería lo más parecido al primer experimento de datamining que culminó con la conclusión de que quienes compraban cerveza en el supermercado aprovechaban para comprar pañales

Para comprobarlo he elegido los nodos que forman un grupo bastante claro (grises), que en la base de datos son los siguientes usuarios: 2005, 2178, 9777, 9844, 1410, 2421, 6497, 15198, 13379. Si la teoría es correcta, su proximidad (agrupación) debería ser el fruto de búsquedas heterogéneas desde el punto de vista semántico, de forma que pudiésemos encontrar un verdadero perfil de usuario subyacente en las búsquedas (y no sólo una coincidencia en frases buscadas).

La lista de expresiones buscadas por estos usuarios (y el número de búsquedas de cada expresión) están en este fichero excel, en el que también incluyo una matriz de las relaciones entre los nodos de la red. De estas búsquedas puede deducirse lo siguiente:

  • Hay un gran porcentaje de búsquedas referentes a “speedo” y “atomic bombs” (bañadores ajustados de hombre y bombas atómicas). Otros temas como radioactividad o tormenta atómica y “chicos con bañadores ajustados” se añaden a esta categoría.
  • Las búsquedas siguen una ley típica de pontencia (Long Tail)…siendo “speedo” la palabra que más búsquedas concentra, pero a medida que bajamos en la lista, las búsquedas se hacen DEMASIADO heterogéneas (no tienen nada que ver).

Algo no está bien…Me he puesto a mirar detalladamente ese cluster, y me he dado cuenta de 2 cosas:

  • El usuario 6497 es un enfermo mental. Ha buscado cosas relacionadas con bañadores “slip” para hombres (speedo) decenas de veces…y es el mismo que busca cosas relacionadas con el holocausto (un verdadero obseso). La cantidad de búsquedas que hace desvían los resultados hacia estos temas, pero relamente no son representativos en el grupo.
  • Lo que une al grupo en realidad es una búsqueda muy trivial: google. Para pesar de AOL, los usuarios de este grupo sólo tienen en común su interés por encontrar la página de Google (lo que si podemos saber es que seguramente están en AOL por “defecto” y que son usuarios muy novatos). El 99% de las relaciones de este grupo son a través de la misma frase de búsqueda: “google”

Vaya…no podemos decir que tengamos un grupo demasiado interesante no? Lo único que estas personas tienen en común es que no están muy satisfechas de AOL como buscador. ¿Y si miramos otro cluster? Por ejemplo, el de color verde claro: 7005, 10191, 10291, 11468, 12420, 13457, y 15565.

Mala suerte…aquí pasa lo mismo con la expresión “mapquest” (otro servicio de Internet). Si examinamos otros grupos sucede lo mismo con ebay, etc. A veces los grupos se ven “ensuciados” por algun obseso, pero en general un análisis más a fondo revela que las únicas uniones que pueden observarse a esta escala son en relación a las grandes webs que todos conocemos.

Conclusiones

Creo que el análisis es correcto y sigo pensando que hay un gran potencial en el estudio de “clusters” dentro de la red de búsquedas-usuarios. Sin embargo (para quien tenga el tiempo o la capacidad de proceso en sus máquinas) para llevarlo a cabo, creo que deberían tenerse en cuenta los siguientes “filtros” antes de procesar la información:

  • Tener en cuenta los perfiles de los que habla Slate. Sobretodo estos 3:
  • El obseso. Puede crear grupos a su alrededor haciéndose más representativo de lo que en realidad es (por el peso de sus enlaces)
  • El novato. Buscará expresiones como “google” o “ebay” o confundirá el campo de búsqueda con el de la URL (y buscará http://www.google.com). Esto ensucia los datos porque en sí no revela nada sobre el usuario
  • En general, habría que eliminar las consultas que no nos dicen nada del usuario (por ejemplo, el que busca google o ebay es un usuario muy neutro).
  • Además, el hecho de contar únicamente con un 1% de la base de datos total ha podido dejar algunas relaciones fuera de la muestra que hubiesen creado verdaderos grupos de usuarios basados en perfiles más significativos.

    Enlaces de Interés

    El análisis de redes tiene por objetivo hacer emerger información implícita que no se vería a primera vista. Sin embargo el mejor análisis es el que miles de personas pueden hacer de forma colaborativa.

    De momento he encontrado 2 alternativas de colaboración para el análisis de esta base de datos: AOLPsycho y Aol Stalker.

    Para una búsqueda directa se puede utilizar AolSearchDatabase