Pig Illustrate

  

Una intelligente opzione fornita da Pig è costituita dal comando ILLUSTRATE il quale produce in maniera automatica, esaminando lo script che si desidera mettere sotto test, un set di records che consente una verifica più completa delle proprie procedura.

Il comando ILLUSTRATE di Pig esegue un efficace campionamento di dati sull'intero data set con queste caratteristiche:

- esamina il codice per determinare quali dati sono necessari

- genera un set di record che in maniera appropriata esercitano il codice Pig realizzato

 

A differenza del comando SAMPLE che estrae dal data set un insieme percentuale su base casuale, ILLUSTRATE opera in maniera più intelligente e raccoglie un insieme di record più adatto al test.

 

 

Blogs network

Iscrizione alla newsletter

I agree with the Privacy e Termini di Utilizzo
Con l'iscrizione riceverai news sul mondo dell'IT e Big Data.
Back to Top