
¿Alguna vez ha deseado comprender toda la potencia que esconden los rankings de búsqueda o las recomendaciones de productos por Internet? La inteligencia colectiva surge de la colaboración y la competición de muchos individuos. Constituye el proceso de análisis y extracción de conocimiento procesable, implícito en las bases de datos a partir del desarrollo de aplicaciones Web.
En este libro encontrará algoritmos muy sofisticados y programas inteligentes para acceder a conjuntos de datos de sitios Web, analizarlos y comprenderlos. Conseguirá realizar estadísticas y conclusiones sobre usabilidad, marketing, gustos personales, y comportamiento de grupos humanos en general. Cada algoritmo está descrito de modo riguroso, con código listo para usarse de inmediato.
Aprenderá a utilizar las técnicas de filtrado colaborativo que permiten a los vendedores recomendar productos, los métodos de agrupación para detectar elementos similares en grandes conjuntos de datos, las características de los motores de búsquedas y los filtros bayesianos.



Más OFERTAS si compra "Inteligencia colectiva. Desarrollo de aplicaciones Web 2.0" junto a



Prólogo
Introducción
Requisitos previos
Estilo de ejemplos
¿Por qué Python?
Consejos sobre Python
Constructores de lista y diccionarios
Espacio en blanco significativo
Listas por comprensión
API abiertas
Visión de conjunto de los capítulos
Convenciones
Código fuente
Sobre la imagen de la portada
Capítulo 1. Introducción a la inteligencia colectiva
¿Qué es inteligencia colectiva?
¿Qué es aprendizaje automático?
Límites del aprendizaje automático
Ejemplos reales
Otros usos de los algoritmos de aprendizaje
Capítulo 2. Realizar recomendaciones
Filtrado colaborativo
Recopilar preferencias
Encontrar usuarios similares
Resultado de distancia euclídea
Coeficiente de correlación de Pearson
¿Qué métrica de semejanza debería utilizar?
Clasificar los críticos
Recomendar elementos
Productos coincidentes
Crear un recomendador de vínculos de del.icio.us
La API de del.icio.us
Crear el conjunto de datos
Recomendar vecinos y vínculos
Filtrado basado en elementos
Crear el conjunto de datos de comparación de elementos
Obtener recomendaciones
Utilizar el conjunto de datos MovieLens
¿Filtrado basado en usuarios o en elementos?
Ejercicios
Capítulo 3. Descubrir grupos
Aprendizaje supervisado frente a no supervisado
Vectores de palabras
Encasillar a los bloggers
Contar las palabras en un feed
Clustering jerárquico
Dibujar el dendrograma
Clustering de columna
Clustering k-media
Clústeres de preferencias
Obtener y preparar los datos
Beautiful Soup
Examinar los resultados de Zebo
Definir una métrica de distancia
Resultados de clustering
Ver datos en dos dimensiones
Otras cosas a agrupar
Ejercicios
Capítulo 4. Buscar y clasificar
¿Qué es un motor de búsqueda?
Un sencillo robot de búsqueda
Utilizar urllib2
Código del robot de búsqueda
Crear el índice
Configurar el esquema
Encontrar las palabras en una página
Añadir al índice
Realizar consultas
Clasificación basada en el contenido
Función de normalización
Frecuencia con que aparece una palabra
Ubicación en el documento
Distancia entre palabras
Utilizar vínculos entrantes
Cuenta sencilla
El algoritmo PageRank
Utilizar el texto del vínculo
Aprendiendo de los clics
Diseño de una red de mapa de clics
Configurar la base de datos
Feed Forward
Aprendizaje con propagación hacia atrás de errores
Prueba de aprendizaje
Conectarse al motor de búsqueda
Ejercicios
Capítulo 5. Optimización
Viaje en grupo
Representar soluciones
La función de coste
Búsqueda aleatoria
Hill Climbing
Templado simulado
Algoritmos genéticos
Búsquedas reales de vuelos
La API Kayak
El paquete minidom
Búsquedas de vuelos
Optimizar para preferencias
Optimización de residencia de estudiantes
La function cost
Lanzar la optimización
Visualización de redes
El problema del diseño
Contar las líneas que se cruzan
Dibujar la red
Otras posibilidades
Ejercicios
Capítulo 6. Filtrar documentos
Filtrar spam
Documentos y palabras
Enseñar al clasificador
Calcular probabilidades
Empezar con una suposición razonable
Un clasificador inexperto
Probabilidad de todo un documento
Introducción al teorema de Bayes
Elegir una categoría
El método Fisher
Probabilidades de categoría para características
Combinar las probabilidades
Clasificar elementos
Continuar con los clasificadores enseñados
Utilizar SQLite
Filtrar feeds de blogs
Mejorar la detección de características
Utilizar Akismet
Métodos alternativos
Ejercicios
Capítulo 7. Modelar con árboles para la toma de decisiones
Predecir inscripciones
Presentar los árboles para la toma de decisiones
Entrenar el árbol
Elegir la mejor división
Impureza Gini
Entropía
Crear árboles recursivos
Mostrar el árbol
Visualización gráfica
Clasificar nuevas observaciones
Podar el árbol
Tratar con datos que faltan
Tratar con resultados numéricos
Modelar precios de casas
La API de Zillow
Modelar 'idoneidad'
Cuándo utilizar árboles para la toma de decisiones
Ejercicios
Capítulo 8. Construir modelos de precio
Crear un conjunto de datos de ejemplo
k-vecinos más cercanos
Número de vecinos
Definir semejanza
Código para k vecinos más cercanos
Vecinos ponderados
Función inversa
Función resta
Función gaussiana
kNN ponderado
Validación cruzada
Variables heterogéneas
Agregar al conjunto de datos
Escalar dimensiones
Optimizar la escala
Distribuciones desiguales
Estimar la densidad de probabilidad
Representar gráficamente las probabilidades
Utilizar datos reales: la API de eBay
Conseguir una clave de desarrollador
Configurar una conexión
Llevar a cabo una búsqueda
Obtener detalles para un elemento
Crear un indicador de precios
Cuándo utilizar los k vecinos más cercanos
Ejercicios
Capítulo 9. Clasificación avanzada: métodos kernel y SVM
Conjunto de datos del emparejador
Dificultades con los datos
Clasificador de árbol para la toma de decisiones
Clasificación lineal básica
Características categóricas
Preguntas Sí/No
Listas de intereses
Determinar distancias utilizando Yahoo! Mapas
Obtener una clave de aplicación Yahoo!
Utilizar la API Geocoding
Calcular la distancia
Crear el nuevo conjunto de datos
Escalar los datos
Entender los métodos kernel
El truco del kernel
Máquinas de vectores soporte
Utilizar LIBSVM
Obtener LIBSVM
Una sesión de ejemplo
Aplicar SVM al conjunto de datos emparejador
Buscar coincidencia en Facebook
Obtener una clave de desarrollador
Crear una sesión
Descargar datos de amigos
Crear un conjunto de datos de concordancia
Crear un modelo SVM
Ejercicios
Capítulo 10. Encontrar características independientes
Un corpus de noticias
Seleccionar fuentes
Descargar fuentes
Convertir a una matriz
Enfoques anteriores
Clasificación Bayesiana
Clustering
Factorización en matrices no negativas
Una rápida introducción a las matemáticas de matriz
¿Qué tiene que ver esto con la matriz de artículos?
Utilizar NumPy
El algoritmo
Mostrar los resultados
Mostrar por artículo
Utilizar datos del mercado de valores
¿Qué es volumen de compraventa?
Descargar datos de Yahoo! Finanzas
Preparar una matriz
Ejecutar NMF
Mostrar los resultados
Ejercicios
Capítulo 11. Inteligencia en desarrollo
¿Qué es programación genética?
Programación genética frente a algoritmos genéticos
Programas como árboles
Representar árboles en Python
Construir y evaluar árboles
Mostrar el programa
Crear la población inicial
Probar una solución
Un sencilla prueba matemática
Medir éxito
Mutar programas
Crear el entorno
La importancia de la diversidad
Un juego sencillo
Un torneo todos contra todos
Jugar contra gente real
Otras posibilidades
Más funciones numéricas
Memoria
Diferentes tipos de datos
Ejercicios
Capítulo 12. Resumen de algoritmos
Clasificador Bayes
Entrenamiento
Clasificar
Utilizar su código
Fortalezas y debilidades
Clasificador de árbol para la toma de decisiones
Entrenamiento
Utilizar su clasificador de árbol para la toma de decisiones
Fortalezas y debilidades
Redes neurales
Entrenar una red neural
Utilizar su código de red neural
Fortalezas y debilidades
Máquinas de vectores soporte
El truco del kernel
Utilizar LIBSVM
Fortalezas y debilidades
k-vecinos más cercanos
Escalar y variables superfluas
Utilizar su código kNN
Fortalezas y debilidades
Clustering
Clustering jerárquico
Clustering k-media
Utilizar su código de clustering
Escalado multidimensional
Utilizar su código de escalado multidimensional
Factorización en matrices no negativas
Utilizar su código NMF
Optimización
La función de coste
Templado simulado
Algoritmos genéticos
Utilizar su código de optimización
Apéndice A. Bibliotecas de terceros
Universal Feed Parser
Instalación para todas las plataformas
Python Imaging Library
Instalación en Windows
Instalación en otras plataformas
Ejemplo sencillo de uso
Beautiful Soup
Instalar en todas las plataformas
Ejemplo sencillo de uso
pysqlite
Instalación en Windows
Instalación en otras plataformas
Ejemplo sencillo de uso
NumPy
Instalación en Windows
Instalación en otras plataformas
Ejemplo sencillo de uso
matplotlib
Instalación
Ejemplo sencillo de uso
pydelicious
Instalación para todas las plataformas
Ejemplo sencillo de uso
Apéndice B. Fórmulas matemáticas
Distancia euclídea
Coeficiente de correlación de Pearson
Medio ponderado
Coeficiente de Tanimoto
Probabilidad condicional
Impureza Gini
Entropía
Varianza
Función gaussiana
Productos escalares
Índice alfabético
Otros clientes que compraron Inteligencia colectiva. Desarrollo de aplicaciones Web 2.0, también compraron:
Otros libros de Internet: