Libros Urgentes

 
Ciencias Técnicas > Ingeniería > Ingeniería Electrónica > Tratamiento digital de la voz e imagen
 
 
 
 

Tratamiento digital de la voz e imagen

  • Faúndez Zanuy, Marcos, (aut.)
  • Marcombo, S.A.
  • 1ª ed., 1ª imp.(02/2000)
  • 288 páginas; 24x17 cm
  • Idiomas: Español
  • ISBN: 8426712444 ISBN-13: 9788426712448
  • Encuadernación: Rústica
  • Entrega de 24 a 48 horas contra reembolso por agencia urgente*
    • 16.50€ ($21,06)  
 
 

En los últimos años se ha producido una gran revolución en el campo de las tecnologías de la información y las comunicaciones. No se trata tan solo de los nuevos servicios de telecomunicaciones que nos facilitan los contenidos, sino que cada vez más la interrelación entre la imagen y el sonido toma un protagonismo clave a la hora de captar nuestra atención y hacer más agradables los servicios. Este libro pretende dar una visión general de las posibilidades y tendencias actuales en tratamiento de voz e imagen, con el objetivo de proporcionar al lector su puesta al día o iniciación en estos temas.

Entre las aplicaciones cabe destacar;

* La comunicación hombre-máquina, consiguiendo que sea lo más amigable posible: interpretar órdenes (reconocimiento del habla), permitir accesos (reconocimiento de locutor), recibir información de forma oral (conversión texto-voz), etc.

* Uso eficiente de recursos: extraer la información relevante de forma que se ocupe el mínimo ancho de banda posible en aplicaciones de transmisión y/o almacenamiento (codificación de voz e imagen), con especial énfasis en los estándares multimedia.

* Reconocimiento de formas, identificación biométrica de personas, protección de los derechos de la propiedad intelectual, etc.

* Se incluyen numerosas figuras y tablas con las direcciones donde obtener más información de los diferentes productos existentes en el mercado.

Esta obra puede ser adecuada para cursos universitarios y ciclos formativos relacionados con el tratamiento de voz e imagen, aplicaciones multimedia, teoría de la información, realización de trabajos y proyectos de final de carrera, etc., así como para todos aquellos profesionales del sector que deseen actualizar sus conocimientos o introducirse en la materia.

1. INTRODUCCIÓN

1.1. Tipos de señales

1.2. Cuantificación vectorial

1.2.1. Concepto

1.2.2. Proceso de cuantificación

1.2.3. Obtención del codebook inicial

1.2.3.1. Método aleatorio (random)

1.2.3.2. Método de poda (pruning)

1.2.3.3. Método de splitting

1.2.4. Mejora del codebook

1.2.4.1. Iteración de Lloyd

1.2.4.2. Algoritmo de Lloyd generalizado

1.2.5. Variantes de la cuantificación vectorial

1.2.5.1. Cuantificación vectorial clasificada

1.2.5.2. Cuantificación vectorial de vectores transformados

1.2.5.3. Cuantificación vectorial de ganancia y forma

1.2.6. Aplicaciones

1.2.6.1. Codificación Block Truncation Coding (BTC) de imágenes con cuantificación vectorial

1.2.6.2. Cuantificación vectorial de coeficientes LPC (LPC-VQ)

1.3. Redes neuronales artificiales

1.3.1. La neurona biológica

1.3.2. Modelo de neurona artificial

1.3.3. Arquitectura de una Red Neuronal Artificial (RNA)

1.3.3.1. Redes progresivas

1.3.3.2. Redes realimentadas

1.3.4. Aprendizaje

1.3.5. Aplicaciones de las RNA

1.4. Filtros no lineales

1.4.1. Concepto

Tipos de filtros

1.4.2. Filtros de estadísticos ordenados (OS)

2. TRATAMIENTO DE VOZ

2.1. Introducción y aplicaciones

2.2. Fundamentos en tratamiento del habla

2.2.1. Sistema fonador humano

2.2.2. Digitalización de voz

2.3. Codificación de voz

2.3.1. Codificación de forma de onda

2.3.1.1. Cuantificación

2.3.1.2. Predicción lineal

2.3.1.3. Estimación de pitch

2.3.1.4. Espectros y cepstrum

2.3.1.5. Codificación diferencial

2.3.1.6. Modulación delta

2.3.2. Codificación paramétrica

2.3.2.1. Codificación por predicción lineal (LPC)

2.3.2.2. Codificadores de voz mediante análisis por síntesis

2.3.2.3. Excitación por codebook

2.3.2.4. Autoexcitación

2.3.2.5. Multipulso

2.3.3. Evaluación de los codificadores

2.4. Conversión texto-voz

2.4.1. Introducción

2.4.2. Sistemas de respuesta oral versus convertidores texto-voz

2.4.3. Conversión texto-voz

2.4.3.1. Análisis lingüístico del texto

2.4.3.2. Generación de la prosodia

2.4.3.3. Síntesis de la señal de voz

2.4.4. Generación de la base de unidades

2.5. Reconocimiento

2.5.1. Introducción

2.5.2. Aplicaciones

2.5.2.1. Aplicaciones del reconocimiento automático del habla

2.5.2.2. Aplicaciones de reconocimiento de locutor

2.5.3. Reconocimiento de locutor

2.5.3.1. Introducción

2.5.3.2. Adquisición de la señal de voz

2.5.3.3. Extracción de características

2.5.3.4. Modelado no paramétrico

2.5.3.5. Modelos paramétricos

2.5.4. Reconocimiento del habla

2.5.4.1. Introducción

2.5.4.2. Cuantificación vectorial

2.5.4.3. Ajuste de plantillas

2.5.4.4. Métodos estocásticos

2.5.5. Sistemas comerciales

3. TRATAMIENTO DE IMAGEN

3.1. Introducción

3.2. Mejora de imágenes

3.2.1. Introducción

3.2.2. Operaciones puntuales

3.2.2.1. Función definida a intervalos

3.2.2.2. Negativo de una imagen

3.2.2.3. Extracción de bits

3.2.2.4. Procedimientos basados en el histograma

3.2.3. Operaciones espaciales

3.2.3.1. Filtrado espacial

3.2.3.2. Suavizado direccional

3.2.3.3. Filtrado de mediana

3.2.3.4. Ampliación de imágenes

3.2.4. Operaciones transformadas

3.2.5. Restauración de imágenes

3.2.6. Pseudocolor

3.3. Compresión

3.3.1. Introducción

Tipos y aplicaciones

3.3.1.1. Aplicaciones

3.3.1.2. Máxima compresión conseguible sin error

3.3.2. Codificación de pixel

3.2.2.1. PCM

3.3.2.2. Cuantificación de contraste

3.3.2.3. Dithering

3.3.2.4. Codificación entrópica

3.3.2.5. RLE (Run Length Encoding)

3.3.2.6. Codificación de bit plane

3.3.3. Codificación predictiva

3.3.3.1. DPCM (Differential Pulse Code Modulation)

3.3.3.2. Modulación delta

3.3.3.3. Técnicas adaptativas

3.3.4. Codificación transformada

3.3.4.1. Codificación zonal y codificación umbral

3.3.4.2. Codificación transformada adaptativa

3.3.5. Codificación híbrida

3.3.6. Codificación piramidal

3.3.7. JPEG (Joint Photographic Experts Group)

3.3.8. Codificación de imágenes en color

3.4. Secuencias de imágenes

3.4.1. Aplicaciones

3.4.2. Estimación de movimiento

3.4.2.1. Método three step

3.4.2.2. Método conjugado modificado

3.4.3. Predicción

3.5. Morfología matemática

3.5.1. Definición

3.5.2. Operaciones

3.6. Visión artificial

3.6.1. Detección de contornos

3.6.2. Formas de objetos

3.6.2.1. Método de las firmas

3.6.3. Reconocimiento óptico de caracteres

3.6.3.1. Método de los perfiles

3.6.3.2. Reconocimiento de caracteres por el método de los perfiles

3.6.3.3. OCR con red neuronal

3.6.4. Reconocimiento de personas mediante características biométricas

3.6.4.1. Aplicaciones y ventajas sobre los métodos tradicionales

3.6.4.2. Precisión del sistema

3.6.4.3. Cuestiones importantes

3.6.4.4. Huellas dactilares

3.6.4.5. Geometría de la mano

3.6.4.6. Geometría de los dedos

3.6.4.7. Venas de las manos

3.6.4.8. Retina

3.6.4.9. Iris

3.6.4.10. Firma

3.6.4.11. Reconocimiento de caras

3.6.4.12. Mejoras en las aplicaciones de verificación

3.6.4.13. Sistemas implantados en la actualidad

4. SISTEMAS MULTIMEDIA

4.1. Equipos de videoconferencia

4.1.1. Compresión de imágenes mediante H.261

4.1.1.1. Esquema del codificador

4.1.2. Estándar H.263

4.1.3. Diferencias entre los sistemas H.263 y H.261

4.1.4. Estándar H.263 versión 2

4.2. Estándares de codificación MPEG

4.2.1. Estándar MPEG-1 para codificación de imagen

4.2.2. Estándar MPEG-2 para codificación de imagen

4.2.3. Estándar MPEG-3 para codificación de imagen

4.2.4. Estándar MPEG-4 para codificación de imagen

4.2.5. Estándar MPEG-7

4.3. Codificación de audio

4.3.1. Estándar de codificación de audio MPEG-1

4.3.2. Estándar de codificación de audio MPEG-2

4.3.3. Estándar de codificación de audio MPEG-4

4.4. Nuevos estándares

4.5. H.323: Estándar de sistemas de comunicaciones multimedia sobre redes basadas en paquetes

4.5.1. Introducción

4.5.2. Características de los terminales H.323

4.5.3. Interoperabilidad con otros terminales de transmisión de datos, audio y/o vídeo

4.5.4. Equipos disponibles en el mercado

4.5.5. Videoconferencia sobre Internet

4.5.6. Coste de los equipos

4.6. Nuevas tecnologías y protección de los derechos de la propiedad intelectual

4.6.1. Introducción

4.6.1.1. Información oculta y criptografía

4.6.1.2. Información oculta y firma digital

4.6.1.3. Información oculta y marcas de agua

4.6.2. Tipos de marcas de agua

4.6.3. Marcado de imágenes

4.6.4. Marcado de señales de audio

4.6.5. Marcado de textos

4.6.6. Programas comerciales

5. PROBLEMAS

6. BIBLIOGRAFÍA

Otros libros de Faúndez Zanuy, Marcos son Sistemas De Comunicaciones, Circuitos Electrónicos Para Sistemas De Comunicaciones, Ejercicios Resueltos Para Sistemas De Comunicaciones y Libro Blanco De Grupos De Investigación En Reconocimiento Biométrico De Personas.


 

Otros clientes que compraron Tratamiento digital de la voz e imagen también compraron:

 

Principios De Comunicaciones Móviles

  • Sallent Roig, Oriol; Valenzuela González, José Luis; Agustí Comes, Ramon
  • 226 páginas
  • 22,20€ ($28,33)
  • En este libro se presentan los aspectos fundamentales que intervienen en los sistemas de comunicaciones móviles, al objeto de facilitar la comprensión de los principios de funcionamiento y los requerimientos tanto actuales como futur
 

Diccionario De Enigmística

  • Hidalgo de la Torre, Rafael; Parisi, Beatrice
  • 230 páginas
  • 17,80€ ($22,72)
  • Rebus, bifronte, criptografía mnemónica, onomancia, empotre son algunos de los lemas que vertebran este pequeño Diccionario que ofrece un panorama ágil y al mismo tiempo exhaustivo de la enigmística, una rama de los jueg
 

Criptografía Digital. Fundamentos Y Aplicaciones

  • Pastor Franco, José; Sarasa López, Miguel Ángel; Salazar Riaño, José Luis
  • 691 páginas
  • 24,64€ ($31,44)
  • Manual pensado para los alumnos que cursan el último año de Ingeniería de Telecomunicaciones y para quienes están realizando cursos de doctorado de la especialidad.
 

Guía Técnica De Aplicación Del Rbt

  • España. Ministerio de Ciencia y Tecnología
  • 472 páginas
  • 20,40€ ($26,04)
  • El actual Reglamento Electrotécnico para Baja Tensión, aprobado por el RD 842/2002 de 2 de agosto, plantea, en el artículo 29, la realización de una serie de Guías Técnicas de Aplicaci&
 
 
 
 

Otros libros de Ingeniería Electrónica:

 

Electrónica Digital: Introducción A La Lógica Digital, Teoría, Problemas Y Simulación

  • Pérez Martínez, Julio; Acha Alegre, Santiago Emilio ... [et al.]
  • 750 páginas
  • 42,50€($54,24)
 

Circuitos Electronicos Analisis, Simulacion Y Diseño

  • Malik, N. R.
  • 900 páginas
  • 66,96€($85,44)
 

Principios Digitales 3ª Ed.

  • Tokheim, Roger L.
  • 480 páginas
  • 40,00€($51,04)
 

Catalogación De Recursos Electrónicos

  • España. Dirección General del Libro, Archivos y Bibliotecas; Estivill i Rius, Assumpció
  • 277 páginas
  • 23,00€($29,36)
 

Curso Práctico De Análisis De Circuitos

  • Sanchís Kilders, Pablo; Part Escrivá, María Consuelo; Marín-Roig Ramón, José
  • 183 páginas
  • 18,40€($23,48)
 
 
 
 
Comentarios de los usuarios (0)
 
 
 
 
 


 
Sé el primero en comentar Tratamiento digital de la voz e imagen


Apodo:

Valoración del libro (sobre 10):

Comentario:


 
 
 
*Para España. Tiempo estimado para días laborables.

 

Buscar: libro, autor, ISBN...