Ciencia de la web

ENTRADA ESPECIAL DEL BLOG
ASIGNATURA CIENCIA DE LA WEB: ENTENDIENDO Y USANDO LA WEB SOCIAL
Esta entrada del blog es un resumen de lo aprendido en el curso, que servirá para poder comentar lo tratado en el mismo.
Para un mejor desarrollo del resumen, estará dividido en cuatro secciones, correspondientes a cada una de las clases impartidas.
1- BLOGOSFERA Y MICROBLOGGING
Las herramientas de comunicación que usan de base Internet nos han interconectado globalmente.
i) Bases de las redes de computadores: Para que haya comunicación entre diversas máquinas, es imprescindible definir una serie de niveles de protocolos de comunicación, que en el caso de Internet son los niveles  TCP/IP (nivel físico, de red, de transporte, de aplicación). Destacamos el protocolo de nivel de aplicación HTTP o de transferencia de hipertexto, que es el usado en cada transacción de la Worl Wide Web.
Otros componentes fundamentales son los lenguajes de programación web, como HTML o XML, que son herramientas de desarrollo.
Destacaremos entre los diversos tipos de tecnología  de red que existen ADSL, que es una tecnología de acceso a Internet de banda ancha, lo que implica una velocidad de conexión alta. Simplemente indicar de ella que tiene como parámetros característicos su velocidad de subida y bajada de datos, distintas, por lo que es asimétrica (en un principio fue simétrica) siendo la de bajada mayor por necesitar mayor ancho de banda para descargas, ver webs..
Por último indicar que la organización de los recursos en Internet se basa en el URL, o localizador uniforme de recursos, es una secuencia de caracteres, de acuerdo a un formato modélico y estándar, que se usa para nombrar recursos en Internet para su localización o identificación. También tenemos el URI o identificador de recurso exterior.
ii) Blog: diario online formado por entradas sobre un tema de interés con un orden inverso temporal, con enlaces a otros sitios, comentarios... Primeras redes de conversaciones asíncronas (no desarrolladas en tiempo real). En un foro todo queda dentro de él, mientras que un blog es abierto, con enlaces, referencias. Construí mi blog de la asignatura con el software de bllogger.com, de google, uno de los indicados en la clase, abriendo una cuenta de google, y construendo su título, eligiendo una plantilla adecuada, etc.
En los blogs, tenemos las tribus, grupos diferenciados según temas de interés.
Destacar dos conceptos importantes de los blogs: El protocolo de subscripción o RSS y los mashups (página web o aplicación que usa y combina datos, presentaciones y funcionalidad procedentes de una o más fuentes para crear nuevos servicios. El término implica integración fácil y rápida, usando a menudo APIs abiertos y fuentes de datos para producir resultados enriquecidos que no fueron la razón original para la que fueron producidos los datos en crudo originales).
En medios sociales, el término planeta  se refiere a un sitio web agregador cuyo contenido está exclusivamente compuesto por los mensajes de un conjunto de bitácoras o blogs que normalmente comparten una temática común.
ejemplo: http://googleblog.blogspot.com/
Blogosfera: término bajo el cual se agrupa la totalidad de weblogs o blogs. Debido a que los blogs o las bitácoras están conectadas por medio de enlaces, comentarios, históricos y referencias han creado y mantenido su propia cultura.
Podemos considerar Blogosfera como un sistema virtual, en el que se establecen comunidades de weblogs, categorizados temáticamente o por perfiles de interés. Estos conforman, pues, el mensaje y la blogosfera, el lugar para habitar en Internet.
Permalink: Enlace que no cambia con el tiempo. Se usa en los blogs para asignar una URL permanente a cada entrada del blog, para luego poder referenciarla. De esta forma estamos identificando de manera unívoca un contenido (artículo, discusión, análisis,..) sobre un tema o cuestión en el blog de destino. Es decir, se facilita el acceso (y una referencia) directo a todos aquellos que puedan estar interesados en el contenido referenciado.
iii) Microblogging:  Para enviar mensajes cortos, de longitud de un SMS. Destaca Twitter como herramienta de comunicación. Puedes seguir a personas que te interesen especialmente. Es tal su éxito que su uso ( el número de tweets enviados) ha tenido un crecimiento exponencial.
Tenemos en Twitter conceptos como los de blogstags, listas, etc.
Son enlaces asimétricos los que se crean con Twitter, ya que tú sigues a alguien que no te tiene que seguir a ti, a diferencia de Facebook, que sí es simétrico.

2- LA ARQUITECTURA DE LAS APLICACIONES DE INTERNET
En esta clase he visto conceptos que conocía debido a dos asignaturas de mi carrera, Ing. Informática UPM, que se llaman Redes de Computadores (tercer curso) y Arquitectura de Redes de Comunicaciones (cuarto curso). Se estudian los protocolos de los distintos niveles de comunicaciones (OSI y TCP/IP), desde el nivel físico hasta el nivel de aplicación. Podemos destacar por su importancia el protocolo IP, de nivel de red, en sus distintas versiones ipv4 e ipv6, con sus distintos formatos de direcciones de Internet (direcciones IP). El manejo de las direcciones IP, de 32 bits, con su parte de red, subredes y máquina es muy importante.
También destacamos de los otros niveles de comunicaciones el nivel de enlace (nivel 2) con sus distintos protocolos como la familia HDLC, los formatos de trama, etc
Dentro de los protocolos de transporte, los más importantes son TCP, fiable y orientado a conexión, encaminador de segmentos, y UDP, no fiable y no orientado a conexión, que transmite datagramas UDP.
Se debe conocer el uso y funcionamiento de protocolos de nivel de aplicación, y las aplicaciones que se sustentan en ellos, como http, telnet para conexión remota,, ftp para transferencia de archivos, DNS para traducción de nombres simbólicos, smtp para correo, etc.
Las aplicaciones cliente-servidor, los sockets, el número de puerto.. todo ello sienta las bases para la comunicación a través de una red.
Destacaremos también el papel de los routers, encaminadores o gateways. Encargados de dirigir la información da su destino mediante tablas de encaminamiento el uso de máscaras, direcciones de red e interfaces. Estos equipos tienen una configuración especial (no se ocupan de los niveles superiores al de red, etc). Pueden realizar protección de las direcciones de una red mediante traducciones y uso de los número de puerto, etc.
Lenguaje HTML: Plataforma HTML o HTML5. Junto con Java (Javascripts..), XML, XHTML... forma una base para el desarrollo de aplicaciones de Internet o web. Define la estructura de un texto (cabecera, cuerpo o body formato..) con directivas, etc. Ejemplo: <TITTLE> Título <TITLE>
Javascripts: Lenguaje por excelencia de aplicaciones de cliente, con sintaxis similar a Java. Usado junto a HTML para el desarrollo de scripts.
HTTP: Es el protocolo transaccional de acceso a  recursos (de servidores) mediante la URL o dirección web. Con él conseguimos que se carguen páginas web en nuestro ordenador.
GET (lee) POST (escribe)  PUT(crea)...
3-  WIKIS Y HERRAMIENTAS DE COLABORACIÓN
Hay una serie de herramientas de colaboración, tanto síncronas como asíncronas.
i) Wikis, su uso y edición: La finalidad de un wiki (aplicación sobre un servidor de páginas web)es que varios usuarios puedan colaborar entre sí, editar y modificar contenidos de forma rápida, y mantener información adicional sobre dicha información, que sirve para gestionarla mejor, como historiales de cambios (con direcciones IP) etc. Es una herramienta síncrona, que tiene por debajo tecnología http (protocolo de transferencia de hipertexto).
La clave de su éxito está en la posibilidad de una sencilla edición, sin necesidad de conocer un lenguaje de programación web determinado, como html, xml y otros muchos.. y usando un navegador normal sin características especiales. También resulta sencilla la creación de enlaces entre páginas, fomentando la conectividad.
Otra peculiaridad es la reversibilidad de los cambios introducidos en la información que se maneja, lo que sirve de mecanismo de protección para su posible restauración. Se gestionan los cambios recientes, hay una revisión de contenidos, se analizan diferencias entre versiones.
En un wiki, prima el contenido y la obtención de información dinámicamente, a la forma de ésta.
Ejemplos: wikipedia, wikitravel, wiktionary, CD wiki...hay todo tipo de wikis
Wikipedia: Es la wiki mayor que existe. Es la enciclopedia de Internet por excelencia y unos de los sitios web más visitados (en octavo lugar). Es una enciclopedia libre (no tiene derechos reservados, no se cobra, puede tener temas que no convergen, lo que no quiere decir que sea anárquica), colaborativa, abierta, plurilingüe (aunque la editada en inglés tiene más calidad), que tiene la característica de que sus artículos (la mayoría) pueden ser editados y corregidos por los usuarios.
No es una fuente de información exenta de errores. Hay unos índices de calidad y páginas de discusión.
Las versiones de su contenido sufren continuas renovaciones, lo que ayuda a su actualización.
No tiene normas rígidas, lo que la hace flexible. Siempre teniendo en cuenta que no podemos escribir lo que nos apetezca. Su contenido sí es libre. Hay moderadores para controlar su funcionamiento, controlar posibles vandalismos, autorizar cambios..
No tiene dueños, es patrimonio de todos. Sí hay personas más involucradas en el muno de la wikipedia, voluntarios, que participan en encuentros, proyectos, etc. Operada por la fundación Wikimedia, con secciones locales en distintos países.
Hay distintos roles dentro de wikipedia; usuarios registrados o no, administradores, burócratas.. y más..
El crecimiento de wikipedia no será exponencial, ya que nuestro conocimiento tampoco lo es, está limitado.
Tiene opciones sencillas para su manejo: View History (ver historial) Discussion (Conversaciones sobre un tema) Edit (editar la información en una caja de texto con la posibilidad de salvarla, etc. Como detalle, si usamos un enlace a otra web que esté en color rojo, es que no existe; se crea, se establecen enlaces.
Usuarios: Es importante que haya usuarios de distintos perfiles. Adders, synthetizers, minimalists, multiplexers..
Gestores wikis: software para gestionar características tales como historiales de cambios, permisos, versiones de páginas, foros asociados..
Característica WYSIWYG (what you see is what you get)
Ejemplos: Mediawiki, Twiki, MoinMoin.. y muchos más.
4- FILTROS COLABORATIVOS Y SISTEMAS DE RECOMENDACIÓN
i) Groupware:  Es un software de apoyo para la realización de un trabajo de forma colaborativa y distribuida (a través de una red). Provee un interfaz para el desarrollo del mismo. Así se logra que los usuarios puedan interactuar de forma cómoda. Se desarrolla una Comunicación, Colaboración y Coordinación.
Workflow: Sistema que ayuda a administrar y automatizar procesos de negocio. Son su flujo y control. Los documentos, información y tareas se realizan de acuerdo a un conjunto de reglas preestablecidas.
Yo estoy más familiarizada (debido a que estudio Ing. Informática en la UPM) con este tipo de procesos usados en el desarrollo de proyectos software, conociendo la ingeniería software desde su etapa inicial de especificación de requisitos por parte de un cliente hasta la fase final que trata de pruebas, mantenimiento, etc. del producto.
ii) Sistemas de Recomendación: Compara el perfil del usuario con características de temas o ítems de información para ofrecerle lo más adecuado, gracias a que previamente se han recopilado datos de dicho usuario implícita o explícitamente. Es un filtro de información en un dominio determinado en base a la información de la que dispone.
Relacionado con el concepto de dominio  tenemos el de taxonomía, que nos sirve para definir el mismo; define sus conceptos principales, su jerarquía interna, sus propiedades o atributos, etc.
Yo conozco también el uso de técnicas de definición de dominios, como son el Análisis de Protocolos y las ontologías.
Hay distintas técnicas de recomendación (basadas en el conocimiento, en la utilidad para el usuario..) y algoritmos de recomendación para encontrar la preferencia.
Ejemplos de SR:  Amazon.com -compra por Internet
                              Pandora - servicio de música
                              Daily Me - recomendación de noticias
  SR Colaborativos: Después del estudio de usuarios con intereses similares, realiza sugerencias y predicciones. Hay filtros colaborativos Basado en Memoria (usando el algoritmos del vecino más próximo) y Basado en Modelo (usan un aprendizaje mecánico para construir un sistema de valloraciones de usuarios).
En clase también hemos visto la forma de evaluar los SR, con métodos estadísticos y métricas de decisión.
SR basados en Contenido: Recomienda ítems similares a los que previamente valoró el usuario, teniendo en cuenta cuáles valora más éste.
SR Híbridos: Tiene características de los dos tipos anteriores de SR.
Nota final
Como final de estas cuatro clases, podemos decir que tanto las redes sociales, como las comunidades (de negocio, etc) y las herramientas derivadas de la web semántica 2.0 (Ebay, Youtube, Wikipedia, Facebook, google,  etc) son herramientas tan extendidas que es casi obligado conocerlas. Es el comienzo de la Internet del futuro.