Cloud Computing (VI): Almacenamiento como servicio (DaaS) y Comunicaciones como servicio (CaaS)

Cloud Computing Servicios DaaS y CaaSDentro de las opciones que ofrece Cloud Computing en la exteriorización de servicios, quizá una de las más atractivas sea el almacenamiento de datos (Data Warehouse) y la delegación de las comunicaciones con terceros. Esta marcada tendencia a externalizar en todo lo posible los servicios clave de IT tiene como objetivos, por un lado, el abaratamiento de los costos para las grandes empresas ya establecidas, que buscan reducir gastos en costos de mantenimiento y actualización hardware/software, además de tener una opción de almacenamiento alterna para eventuales emergencias. Por otro lado, y aquí es donde está el verdadero negocio, proporciona una puerta de entrada muy atractiva a las pequeñas empresas que no pueden pagar los costos de tener un departamento de IT propio, pero que no pueden prescindir de dichos servicios. Para estos últimos, las opciones Data Warehouse-as-a-Service (DaaS) y Communications-as-a-Service (CaaS) son fundamentales para tener la necesaria presencia digital en Internet sin destinar una gran parte de su presupuesto en ello.

 

Almacenamiento como servicio (DaaS)

El término Data Warehouse fue acuñado por Bill Inmon  [1] en 1990, el cual es considerado el padre del Data Warehouse, que lo definió de la siguiente manera: «Un almacén de datos que está, orientado a temas, a almacenar un conjunto de datos, en forma integrada,  no volátil, y variantes en el tiempo, los cuales se usan en apoyo a los procedimientos de toma de decisiones en la gerencia”. Los términos clave que definen esta afirmación son [2]:

 

  1. Orientado a Temas: Una primera característica del Data Warehouse es que la información se clasifica en base a los aspectos que son de interés para la empresa. Siendo así, los datos tomados están en contraste con los clásicos procesos orientados a las aplicaciones.
  2.  

  3. Integración: El aspecto más importante del ambiente Data Warehousing es que la información encontrada al interior está siempre integrada. La integración de datos se muestra de muchas maneras: en convenciones de nombres consistentes, en la medida uniforme de variables, en la codificación de estructuras consistentes, en atributos físicos de los datos consistentes, fuentes múltiples y otros.
  4.  

  5. De Tiempo Variante: Toda la información del Data Warehouse es requerida en algún momento. Esta característica básica de los datos en un depósito, es muy diferente de la información encontrada en el ambiente operacional. En éstos, la información se requiere al momento de acceder. En otras palabras, en el ambiente operacional, cuando usted accede a una unidad de información, usted espera que los valores requeridos se obtengan a partir del momento de acceso. Como la información en el Data Warehouse es solicitada en cualquier momento (es decir, no «ahora mismo»), los datos encontrados en el depósito se llaman de «tiempo variante».
  6.  

  7. No Volátil: La información es útil sólo cuando es estable. Los datos operacionales cambian sobre una base momento a momento. La perspectiva más grande, esencial para el análisis y la toma de decisiones, requiere una base de datos estable.

 

Por otro lado, según Vincent Rainardi [3], un almacén de datos (data warehouse) es un sistema que recupera y consolida los datos periódicamente desde el sistema fuente en un almacén de datos dimensional o normalizado. Por lo general, mantiene muchísimos años de historia de datos, los cuales son solicitados por aplicaciones de inteligencia de negocios o de otras actividades de análisis. Normalmente se actualiza en lotes, y no cada vez que una transacción ocurre en el sistema fuente. Los puntos clave en esta definición son:

 

  1. Recuperación de datos: Se realiza por un conjunto de rutinas ampliamente conocidas como sistema ETL, que es una abreviatura para extraer, transformar y cargar (extract, transform and load). El sistema ETL es un conjunto de procesos que recuperar datos desde el sistema fuente, transformar los datos, y los carga en el sistema de destino. La transformación se puede utilizar para modificar los datos y adaptarlos al formato y criterios del sistema destino, para obtener nuevos valores que se cargan en el sistema destino, o para validar los datos del sistema fuente. El sistema ETL no sólo se utiliza para cargar datos en el almacén de datos. También es ampliamente utilizado para cualquier tipo de movimientos de datos.
  2.  

  3. Consolidación de datos: Un almacén de datos consolida muchos sistemas transaccionales. La diferencia fundamental entre un almacén de datos y un sistema front-office transaccional es que los datos en el almacén de datos están integrados. Esta consolidación o integración debe tener en cuenta la disponibilidad de los datos, rangos de tiempo, las distintas definiciones, la conversión, y los ajustes.
  4.  

  5. Periodicidad: La recuperación de datos y la consolidación de estos no ocurre sólo una vez. Este es un proceso que se repite muchas veces, y por lo general a intervalos regulares, diariamente o varias veces al día. Si la recuperación de datos sólo ocurre una vez, los datos se convertirán en obsoletos, y después de algún tiempo no serán útiles. Por otro lado, es necesario asegurarse de que el intervalo de recuperación de datos cumple con los requerimientos de negocio.
  6.  

  7. Almacenamiento dimensional: El DDS (Dimensional Data Store) es una o varias bases de datos que contiene una colección de subconjunto de datos dimensionales o Data Marts. Un almacén de datos dimensional por lo general es de-normalizado, y sus dimensiones están conformadas. Por dimensiones conformado se entiende que los subconjuntos de datos tiene entre ellos las mismas dimensiones.
  8.  

  9. Almacenamiento normalizado: Es un proceso de eliminación de redundancia de datos mediante la aplicación de las reglas de normalización. Un almacén de datos dimensional es el mejor formato para guardar datos en el almacén con la finalidad de consultar y analizar estos que desde un almacén de datos normalizado. Esto se debe a que es más simple de consultar (un nivel de profundidad, en todas las direcciones en el esquema de estrella) y da mejor rendimiento de la consulta. En cambio, un almacén de datos normalizado es el mejor formato para integrar datos de diferentes sistemas fuente. Esto se debe a que sólo hay un lugar para actualizar, sin redundancia de datos, como en un almacén de datos dimensional. El almacén de datos normalizado lo usa generalmente las empresas de almacenamiento de datos. Desde allí los datos se cargan hacia los almacenes de datos dimensionales para su posterior consulta y análisis.
  10.  

  11. Inteligencia de negocios: Es un conjunto de actividades para comprender las situaciones de negocios mediante la realización de diversos tipos de análisis sobre los datos de la empresa, así como sobre los datos externos de terceros para ayudar a hacer la toma de decisiones contemplando aspectos estratégicos, tácticos y operativos,  y en consecuencia adoptar las medidas necesarias para mejorar el rendimiento empresarial. Esto incluye la recopilación, el análisis, la comprensión y la gestión de datos sobre el funcionamiento, actividades de clientes y proveedores, los resultados financieros, los movimientos de los mercados, la competencia, el cumplimiento de las normas, y controles de calidad.

 

Almacenamiento de datos (Data Warehouse)

 

Evidentemente, Cloud Computing necesita soportarse completamente sobre esta estructura de almacenamiento. No obstante, dado el carácter flexible de los servicios en la nube, la infraestructura de almacenamiento de datos debe flexibilizarse también. En este aspecto Bill Inmon  [4] ha hecho referencia a la nueva generación de Data Warehouse nombrada Data Warehouse 2.0, dicha generación consiste en la evolución del modelo tradicional del Data Warehouse a un modelo más adaptable y eficiente.

Los metadatos son la clave de la arquitectura Data Warehouse 2.0, esto permite la adaptabilidad e integración de información estructurada y no estructurada, así mismo, se clasifican diferentes niveles de metadatos, para cubrir todas las necesidades desde el mismo Data Warehouse, en el modelo tradicional los metadatos se administraban en cada herramienta que explotaba la información, ahora es parte del Data Warehouse y permitirá la fácil adaptabilidad de cualquier herramienta de explotación.

Estas son algunas de las ventajas de la arquitectura de Data Warehouse 2.0:

 

  • Contar con datos a un nivel bajo de detalle
  • Unir datos estructurados y no estructurados
  • Soportar diferentes tipos de procesamiento, sin afectar el rendimiento
  • Soportar cambios en los datos a través del tiempo

 

Aunque en los artículos respecto al tema no menciona las posibles desventajas, se puede considerar lo siguiente:

 

  1. Data Warehouse 2.0 es una arquitectura propietaria, que tiene derechos de autor, esto aunque se comenta con una ventaja o beneficio, se puede considerar que este punto pueda evitar que se adapte rápidamente al mercado, situación que en cierta medida está sucediendo a raíz de más de 2 años de su concepción.
  2.  

  3. En la actualidad los proveedores de software todavía están haciendo las adaptaciones a sus productos para la posibilidad de poder interactuar en mayor medida con las especificaciones del Data Warehouse 2.0.

 

Dentro de todos estos aspectos evolutivos relacionados con el almacenamiento,  hace dos años [5] Amazon.com anunció que pondrá a disposición nuevas utilidades para que los usuarios puedan tener un mayor control de la información en base al modelo de Cloud Computing. Entre ellos se encuentran herramientas como CloudWatch, que permite monitorear el servicio; AutoScalling, para hacer ajustes en la capacidad de almacenamiento; y Elastic Load Balancing, que se utilizará para redistribuir la carga de tráfico.

 

Comunicaciones como servicio (CaaS)

Como la necesidad de una garantía de calidad de servicio (QoS) para la comunicación de la red crece para los sistemas de Cloud Computing, la comunicación se convierte en un componente vital de dicha infraestructura. En consecuencia, los sistemas de Cloud Computing están obligados a proporcionar cierta capacidad de comunicación orientada al servicio, configurable, programables, predecibles y fiables. Con este objetivo, el concepto de Comunicación como Servicio (CaaS) surge en apoyo de tales requisitos, así como seguridad de redes, aprovisionamiento dinámico de superposiciones virtuales para el aislamiento de tráfico o ancho de banda dedicado, el cifrado de comunicaciones y monitoreo de redes [6].

Desde el punto de vista de Microsoft, y respecto al desarrollo de la plataforma Azure [7], CaaS es la base en que se fundamenta SaaS, ya que CaaS es quien proporciona orden en los múltiples protocolos que conforman TCP/IP asociados a los diferentes servicios que se desean integrar en SaaS [8].

Por otro lado, Charles Studt and Joseph Hofstader de Dr. Dobb´s Journal [9] proponen otro enfoque a este término. Desde el punto de vista de la Web 2.0, CaaS unifica las redes sociales, Cloud Computing, y los teléfonos inteligentes o Smartphones, proporcionándoles nubes tecnológicas que permiten a los usuarios comunicarse a través de de voz, texto, y multimedia en cualquier dispositivo que prefiera utilizar. Para competir en este mercado, los fabricantes de software, las empresas, y los proveedores de servicios deben introducir los servicios de comunicaciones avanzadas que responden a una necesidad creciente para el valor, la eficiencia, la reducción de costos, y conveniencia.

 

Cloud Computing Servicios

 

Para satisfacer estas necesidades, los proveedores de nube CaaS ofrecerán servicios de telecomunicaciones que pueden ser integrados en aplicaciones de software y los servicios Web. La idea es relativamente nueva: los vendedores pueden tomar ventaja de este enfoque, añadiendo los servicios de voz a aplicaciones, utilizando un sistema basado en los estándares de la API asociada al servicio. CaaS pueden incluir capacidades de voz sobre IP (VoIP), mensajería instantánea, conferencias, colaboración, y aplicaciones de videoconferencia utilizando dispositivos fijos y móviles. El resultado final de este proceso impulsado por CaaS es más comúnmente conocido como Communications Enabled Business Processes (CEBP).

Al proporcionar estas capacidades de comunicaciones para dispositivos móviles y oficinas en casa fuera de los límites empresariales tradicionales, los empleados pueden elevar el servicio al cliente a nuevos niveles personalizados. Los profesionales de servicio al cliente pueden resolver los problemas más rápidamente y las ventas de representantes pueden contactar con perspectivas de gran alcance y las formas personales.  Una plataforma de CaaS abierta también puede redefinir comunicaciones de emergencia y de crisis y la planificación de las empresas. Al crear definiciones de escenarios de crisis, la comunicación puede ser desencadenada por eventos predefinidos, tales como desastres naturales o de otro tipo de crisis. Por ejemplo, un fallo del equipo en una planta de energía podría iniciar SMS o notificaciones de voz a todos los administradores y los ingenieros de mantenimiento correspondiente. Si es necesario, puede iniciar una llamada de conferencia a un grupo predefinido de respuesta de emergencia para evaluar la situación de emergencia y aplicar un plan de crisis.

 

Véase también:

Cloud Computing (I): Teorías y fundamentos de la computación en nube

Cloud Computing (II): Características que definen a la nube

Cloud Computing (III): Software como servicio (SaaS)

Cloud Computing (IV): Plataforma como servicio (PaaS)

Cloud Computing (V): Infraestructura como servicio (IaaS)

 

Referencias:

[1] Reed, Michael. A Definition of Data Warehousing. http://www.intranetjournal.com/features/datawarehousing.html

[2] Ponniah, Paulraj. 2001. Data Warehousing Fundamentals: A Comprehensive Guide for IT Professionals. s.l. : John Wiley & Sons, 2001. ISBN 0-471-22162-7.

[3] Rainardi, Vincent. 2007. Building a Data Warehouse: With Examples in SQL Server. s.l. : Apress, 2007. ISBN-13 (electronic): 978-1-4302-0527-2.

[4] Inmon, Bill. 2006. DW 2.0 – Architecture for the Next Generation of Data Warehousing. http://www.information-management.com/issues/20060401/1051111-1.html

[5] Babcock, Charles. 2009. Amazon Adds CloudWatch Monitoring, Other Services. InformationWeek, 18 de Mayo de 2009. http://www.informationweek.com/news/services/business_process/showArticle.jhtml?articleID=217500680

[6] Lamia Youseff, Maria Butrico, Dilma Da Silva. 2008. Toward a Unified Ontology of Cloud Computing. s.l. : University of California, Santa Barbara, 2008.

[7] Microsoft. 2009. What is the Windows Azure Platform? http://www.microsoft.com/azure/whatisazure.mspx

[8] Hofstader, Joseph. 2007. Communications as a Service. http://msdn.microsoft.com/en-us/library/bb896003.aspx

[9] Charles Studt, Joseph Hofstader. 2009. CaaS: Communications-as-a-Service. http://www.ddj.com/web-development/217600340;jsessionid=JZ3UNBRTCPCMZQE1GHRSKH4ATMY32JVN?_requestid=30068

 

 

Tambien le puede interesar...

2 comentarios

  1. Pingback: Bitacoras.com
  2. Pingback: Bitacoras.com