Apache Parquet

De Documentação
Revisão de 10h32min de 10 de fevereiro de 2024 por Peter (discussão | contribs) (Criou página com ''''Apache Parquet''' é um formato de tabela SQL orientado a colunas, livre e de código aberto, do ecossistema Hadoop. Foi também o formato adotado pela Overture Maps Foundation para preservação, processamento e intercâmbio de dados. É semelhante ao RCFile e ORC (também formatos de colunares do Hadoop), e é compatível com a maioria...')
(dif) ← Edição anterior | Revisão atual (dif) | Versão posterior → (dif)

Apache Parquet é um formato de tabela SQL orientado a colunas, livre e de código aberto, do ecossistema Hadoop. Foi também o formato adotado pela Overture Maps Foundation para preservação, processamento e intercâmbio de dados.

É semelhante ao RCFile e ORC (também formatos de colunares do Hadoop), e é compatível com a maioria dos frameworks de processamento de dados em torno do Hadoop, como Hive, HBase e Spark. Ele oferece eficiente compressão de dados e esquemas de codificação com bom desempenho para lidar com tabelas Big Data complexas.