
¡Nueva actualización de Azure Synapse Analytics! Este mes de junio podrás disfrutar de la solución de prueba de Azure Orbital Analytics y de los libros de juego de Success by Design de Synapse Analytics. Se ha aumentado el tamaño de los conjuntos de SQL sin servidor, se ha lanzado una nueva página de inicio del Explorador Web, nuevas herramientas para ayudarte a crear mapeos ETL y flujos de datos, y ¡muchísimas novedades más que no te puedes perder!
General
Azure Orbital analytics con Synapse Analytics
Ahora se ofrece una solución de prueba de Azure Orbital analytics que muestra una implementación integral de extracción, carga, transformación y análisis de datos espaciales mediante el uso de bibliotecas geoespaciales y modelos de IA con Azure Synapse Analytics. Esta solución también demuestra cómo integrar modelos de Azure Cognitive Services específicos para el sector geoespacial, modelos de IA de socios y modelos de datos propios.
Los datos espaciales procedentes de sensores remotos se caracterizan por su gran volumen, su alta velocidad y su gran variedad. Para democratizar este tipo único de big data espacial, existe una fuerte necesidad de construir una solución altamente escalable basada en la nube para generar conocimientos basados en la inteligencia artificial. La solución aprovecha la computación sin servidor en la nube, el almacenamiento rentable y la alta disponibilidad entre regiones para permitir un flujo de trabajo integrado.
Diagrama de arquitectura del flujo de trabajo con arquitectura de referencia:
La combinación de Azure Orbital analytics con Synapse Analytics en este flujo de trabajo es ideal para las industrias aeroespacial y aeronáutica. Simplifica las tareas de:
- Ingesta y procesamiento de datos rasterizados
- Detección de objetos mediante modelos de IA preentrenados
- Clasificación de masas de tierra mediante modelos de IA
- Seguimiento de los cambios en el entorno mediante modelos de IA
- Conjuntos de datos derivados de conjuntos de imágenes preprocesadas
- Visualización vectorial/consumo de áreas pequeñas
- Filtrado de datos vectoriales y uniones de datos cruzados
Azure Synapse Éxito por diseño
El éxito de un proyecto no es casualidad y requiere una cuidadosa planificación y ejecución. Los libros de juego Success by Design de Synapse Analytics ya están disponibles en Microsoft Docs. El Azure Synapse proof of concept playbook proporciona una guía para el alcance, el diseño, la ejecución y la evaluación de una prueba de concepto para cargas de trabajo de SQL o Spark. Estas guías contienen las mejores prácticas de las implementaciones de soluciones más desafiantes y complejas que incorporan Azure Synapse.
Si está trabajando en la implementación de una solución de Synapse Analytics, incluya el método de éxito de la implementación en su plan de proyecto existente o utilícelo como guía. Encontrará puntos de control clave en cada paso del proceso de implementación para validar el diseño integral de los espacios de trabajo, la seguridad, la integración de datos, SQL y los grupos de Spark.
SQL
Aumento del límite de tamaño del conjunto de resultados
Sabemos que recurres a Azure Synapse Analytics para trabajar con grandes cantidades de datos. Teniendo esto en cuenta, el tamaño máximo de los conjuntos de resultados de consulta en los grupos de SQL sin servidor se ha incrementado de 200 GB a 400 GB. Este límite se comparte entre las consultas concurrentes.
Explorador de datos de sinapsis
Nueva página de inicio del Explorador Web
La nueva página de inicio del Explorador Web de Synapse hace que sea aún más fácil empezar a utilizar el Explorador Web de Synapse. La Web Explorer homepage incluye ahora las siguientes secciones:
- Empezar – Galería de muestras que ofrece consultas y cuadros de mando de ejemplo para casos de uso populares de Synapse Data Explorer.
- Recomendado – Módulos de aprendizaje populares diseñados para ayudarle a dominar Synapse Web Explorer y KQL.
- Documentación – Documentación básica y avanzada de Synapse Web Explorer.
Galería de muestras de Web Explorer
Una gran manera de aprender sobre un producto es ver cómo lo usan otros. La galería de muestras de Web Explorer ofrece ejemplos de extremo a extremo de cómo los clientes aprovechan los casos de uso populares de Synapse Data Explorer, como los datos de registros, los datos de métricas, los datos de IoT y los ejemplos de big data básicos. Cada muestra incluye el conjunto de datos, consultas bien documentadas y un panel de control de muestra.
Acceda a la galería de ejemplos desde la Web Explorer homepage. Desde la sección de inicio de la página web, vaya a Explorar datos de muestra con KQL para acceder a las consultas de muestra o vaya a Explorar cuadros de mando de muestra para abrir los cuadros de mando de muestra.
Capacidades de exploración de los cuadros de mando del Explorador Web
Ahora puede añadir capacidades de desplazamiento a sus cuadros de mando de Synapse Web Explorer. Las nuevas capacidades de exploración le permiten avanzar y retroceder fácilmente entre las páginas de los cuadros de mando. Esto es posible mediante el uso de un filtro contextual para conectar sus cuadros de mando. La definición de estos filtros contextuales se realiza editando las interacciones visuales del mosaico seleccionado en su cuadro de mando.
Configuración de la zona horaria para el Explorador Web
Poder mostrar los datos en diferentes zonas horarias es muy potente. Ahora puede decidir ver los datos en hora UTC, en su zona horaria local o en la zona horaria del dispositivo/máquina supervisada. La configuración de la zona horaria del Explorador Web se aplica ahora tanto a los resultados de la consulta como al cuadro de mandos. Al cambiar la zona horaria, los cuadros de mando se actualizarán automáticamente para presentar los datos con la zona horaria seleccionada.
Data Integration
Opción de unión difusa en la transformación de unión
Se ha añadido la opción de coincidencia difusa con una puntuación de similitud deslizante a la transformación de unión en la asignación de flujos de datos. Puedes crear uniones internas y externas en valores de datos que son similares en lugar de coincidencias exactas. Anteriormente, tenías que utilizar una coincidencia exacta. El valor de la escala deslizante va del 60% al 100%, lo que facilita el ajuste del umbral de similitud de la coincidencia.
Map Data [Disponible de forma generalizada]
También podemos anunciar que la herramienta Map Data ya está disponible de forma general. La herramienta Map Data es un proceso guiado para ayudarle a crear mapeos ETL y flujos de datos de mapeo de sus datos de origen a Synapse sin escribir código.
Reejecución de canalizaciones con nuevos parámetros
Ahora puede cambiar los parámetros de las canalizaciones al volver a ejecutarlas desde la página de Monitorización sin tener que volver al editor de canalizaciones. Después de ejecutar una canalización con nuevos parámetros, puede supervisar fácilmente la nueva ejecución en comparación con la anterior sin tener que cambiar de página.
Tenga en cuenta que, al volver a ejecutar una canalización con nuevos parámetros, se considerará una nueva ejecución de la canalización y no se mostrará en las agrupaciones de reejecución.
Funciones definidas por el usuario [Generalmente disponible]
Nos complace anunciar que las funciones definidas por el usuario (UDF) ya están disponibles de forma general. Con las funciones definidas por el usuario, puede crear expresiones personalizadas que pueden reutilizarse en múltiples flujos de datos de mapeo. Ya no tendrá que utilizar varias veces la misma manipulación de cadenas, cálculos matemáticos u otra lógica compleja. Las funciones definidas por el usuario se agruparán en bibliotecas para ayudar a los desarrolladores a agrupar conjuntos de funciones comunes.
Machine Learning
Entrenamiento distribuido de redes neuronales profundas con Horovod y Petastorm [Public Preview]
Para simplificar el proceso de creación y gestión de pools acelerados por la GPU, Azure Synapse se encarga de preinstalar las librerías de bajo nivel y de configurar todos los complejos requisitos de red entre los nodos de computación. Esta integración permite a los usuarios empezar a utilizar pools acelerados por la GPU en tan solo unos minutos.
Ahora, Azure Synapse Analytics ofrece soporte integrado para la infraestructura de aprendizaje profundo. El tiempo de ejecución de Azure Synapse Analytics para Apache Spark 3.1 y 3.2 ahora incluye soporte para las librerías de aprendizaje profundo más comunes como TensorFlow y PyTorch. El tiempo de ejecución de Azure Synapse también incluye soporte para bibliotecas como Petastorm y Horovod, que se utilizan habitualmente para el entrenamiento distribuido. Esta característica está actualmente disponible en la Vista previa pública.