Computación de muchas tareas - Many-task computing
La computación de muchas tareas ( MTC ) en la ciencia computacional es un enfoque de la computación paralela que tiene como objetivo cerrar la brecha entre dos paradigmas de computación : computación de alto rendimiento (HTC) y computación de alto rendimiento (HPC).
Definición
MTC recuerda a HTC, pero "difiere en el énfasis en el uso de muchos recursos informáticos durante cortos períodos de tiempo para realizar muchas tareas computacionales (es decir, incluidas las tareas dependientes e independientes), donde las métricas primarias se miden en segundos (p. Ej., FLOPS, tareas / s, tasas de E / S de MB / s), a diferencia de las operaciones (por ejemplo, trabajos) por mes. MTC denota cálculos de alto rendimiento que comprenden múltiples actividades distintas, acopladas mediante operaciones del sistema de archivos. Las tareas pueden ser pequeñas o grandes, monoprocesador o multiprocesador, con uso intensivo de computación o de datos . El conjunto de tareas puede ser estático o dinámico, homogéneo o heterogéneo, poco acoplado o estrechamente acoplado. El número agregado de tareas, la cantidad de computación y los volúmenes de datos pueden ser extremadamente grandes. MTC incluye aplicaciones débilmente acopladas que generalmente son de comunicación intensiva pero no se expresan naturalmente usando la interfaz de paso de mensajes estándar que se encuentra comúnmente en HPC, llamando la atención sobre los muchos cálculos que son h eterogéneos pero no "felizmente" paralelos ".
Raicu y col. Además, afirma: "Hay más en HPC que MPI estrechamente acoplado, y más en HTC que trabajos de ejecución prolongada vergonzosamente paralelos . Al igual que las aplicaciones de HPC y la ciencia misma, las aplicaciones se están volviendo cada vez más complejas y abren nuevas puertas para muchas oportunidades de aplicar HPC de nuevas formas si ampliamos nuestra perspectiva. Algunas aplicaciones tienen tantas tareas simples que administrarlas es difícil. Las aplicaciones que operan o producen grandes cantidades de datos necesitan una administración de datos sofisticada para escalar. Existen aplicaciones que involucran muchas tareas, cada una compuesta por tareas MPI estrechamente acopladas. Las aplicaciones acopladas libremente a menudo tienen dependencias entre tareas y, por lo general, utilizan archivos para la comunicación entre procesos. El soporte eficiente para este tipo de aplicaciones en sistemas existentes a gran escala implicará desafíos técnicos sustanciales y tendrá un gran impacto en la ciencia ".
Áreas Relacionadas
Algunas áreas relacionadas son múltiples programas de datos múltiples (MPMD), computación de alto rendimiento (HTC), flujos de trabajo, computación de capacidad o vergonzosamente paralelo . Algunos proyectos que podrían soportar cargas de trabajo de MTC son Condor , Mapreduce , Hadoop , Boinc , Cobalt HTC-mode, Falkon y Swift .