Diseña, programa y opera pipelines complejos con control low-code, gobierno de versiones y fiabilidad lista para producción.
Disponible en AWS Marketplace Basado en Apache DolphinScheduler Diseño de flujos de trabajo low-code para pipelines de producción
Alta disponibilidad y tolerancia a fallos
Alta disponibilidad master-worker, failover automático y sin punto único de fallo
Programación avanzada
Programación cron, basada en eventos, dependencias y batch
Monitorización y alertas
Monitorización en tiempo real, alertas personalizables y seguimiento de SLA
Seguridad y cumplimiento
RBAC, integración LDAP/SSO, registros de auditoría y cifrado
Escalabilidad
Escalado horizontal para miles de flujos en paralelo
Experiencia de producto
Diseña y lanza flujos de trabajo listos para producción de forma visual
Modela dependencias complejas, configura la lógica de tareas con rapidez y pasa del borrador a la ejecución programada sin herramientas extra de orquestación.
Ecosistema de tareas
Más de 30 tipos de tareas integrados para acelerar la entrega
Cubre ingesta, procesamiento, SQL, notificaciones y pasos de ML sin tener que unir herramientas de programación independientes.
Capacidades
Controla lanzamientos, ejecución y fiabilidad desde una sola plataforma
Ofrece a los equipos de datos una capa única de orquestación para la creación de flujos de trabajo, el gobierno de despliegues, la tolerancia a fallos y las operaciones en tiempo de ejecución.
Programación para todo el ecosistema
Ejecuta tareas de datos diversas en un único scheduler con amplios componentes integrados y control de ejecución consciente de versiones.
Diseña los flujos a tu manera
Construye DAGs con herramientas low-code, código o importaciones desde hojas de cálculo para que los equipos lancen flujos más rápido.
Publica con confianza
Promueve flujos entre entornos con despliegues compatibles con CI/CD, empaquetado y gobierno de versiones.
Preparado para batch y streaming
Opera cargas batch y streaming en entornos cloud públicos, privados e híbridos.
Controles de ejecución que protegen los SLA
Reduce fallos con tolerancia a errores, reejecuciones y controles en tiempo de ejecución diseñados para operaciones en producción.
Reglas flexibles de tiempo de negocio
Gestiona calendarios, horas de corte y lógica temporal entre equipos sin coordinación manual.
Base de código abierto
Orquestación empresarial construida sobre Apache DolphinScheduler
Parte del núcleo Apache y añade mayor seguridad, más estabilidad y controles de flujos de trabajo de nivel empresarial.
Apache DolphinScheduler
DolphinScheduler es un proyecto de la Apache Software Foundation. Ofrece una plataforma distribuida y extensible de código abierto para la orquestación de flujos de trabajo con potentes interfaces visuales DAG.
WhaleScheduler se apoya en esa base y añade capacidades empresariales, mayor seguridad y más estabilidad operativa.
Por qué WhaleScheduler
Descubre la diferencia entre la edición comunitaria y una orquestación lista para empresa
Compara una edición comunitaria con el control, la seguridad y el soporte operativo que necesitan los equipos empresariales.
Comunidad
DolphinScheduler
Empresa
WhaleScheduler
Planificación
Gestión de flujos de trabajo por lotes
Planificación
Gestión de flujos de trabajo por lotes
Análisis de linaje SQL basado en el linaje del IDE y del flujo de trabajo
Tareas activadas por condiciones
Planificación de flujos de trabajo por fecha de negocio
Gestión personalizada de calendarios y fechas
Componentes compatibles
Componentes de procesamiento de código abierto como DataX, Sqoop y SeaTunnel
Interfaz drag-and-drop y generación de flujos de trabajo con Python
Versión alfa de la gestión de calidad de datos
Componentes compatibles
Desarrollo en IDE cloud y depuración unificada para SQL y otros lenguajes
Componentes de código abierto y herramientas ETL tradicionales como Informatica
Componentes big data de código abierto y almacenes de datos como Teradata y Greenplum
Interfaz drag-and-drop y generación de flujos de trabajo con Python
Generación de flujos de trabajo y tareas mediante importación de Excel
Gestión de calidad de datos
Depuración en tiempo de ejecución
Reinicio, pausa y detención de flujos de trabajo
Depuración en tiempo de ejecución
Reinicio, pausa, detención, aislamiento de tareas y control de prioridades
Alertas de línea base de flujos de trabajo en tiempo absoluto
Depuración multinivel de flujos de trabajo e IDE
Importación y despliegue en múltiples entornos en línea
Funciones operativas
No compatible
Funciones operativas
Gestión integrada de desarrollo, pruebas y producción con GitHub y GitLab
Permisos y auditoría
Control solo a nivel de usuario y tenant
Registros básicos de auditoría
Permisos y auditoría
Centro de permisos basado en roles con integración en sistemas empresariales
Auditoría con nivel financiero
Vulnerabilidades de seguridad
Detección y contribución de errores impulsadas por la comunidad sin soporte dedicado
Vulnerabilidades de seguridad
Pruebas de seguridad de terceros y remediación de vulnerabilidades de nivel empresarial
Pruebas y ajustes de grado industrial para garantizar la calidad
Servicio y soporte
No compatible
Servicio y soporte
Soporte para entornos de innovación de TI como KP-V10, TDSQL y DaMeng
Rendimiento
Admite millones de tareas y funciona más rápido que herramientas como Airflow
Rendimiento
Las mejoras a nivel de sistema aumentan notablemente el throughput y la concurrencia
Estabilidad
Depende del feedback de la comunidad y del descubrimiento de incidencias
Estabilidad
Probado profesionalmente y con errores corregidos
Más de 8.000 horas de pruebas de fatiga y estabilidad para la versión comercial
Operación y mantenimiento
No compatible
Operación y mantenimiento
Monitorización integral de métricas del sistema
Soporte técnico
No compatible
Soporte técnico
Servicios profesionales de instalación, despliegue, depuración, actualización y soporte