DNGS/Decisões soberanas: mudanças entre as edições

Linha 85: Linha 85:
[[Arquivo:Sfc4q-intervals-Z-problem2.png|miniaturadaimagem|480px|Intervalos 4-9 (verde), 28-34 (lilás) e 55-58 (azul), mostrando o crescente de interrupções na Curva de Morton conforme se avança no tamanho da grade. Os intervalos são sempre contíguos em Hilbert.]]
[[Arquivo:Sfc4q-intervals-Z-problem2.png|miniaturadaimagem|480px|Intervalos 4-9 (verde), 28-34 (lilás) e 55-58 (azul), mostrando o crescente de interrupções na Curva de Morton conforme se avança no tamanho da grade. Os intervalos são sempre contíguos em Hilbert.]]


<!-- Em computação, o balanceamento de cargas entre partições de disco requer a escolha de geocódigos de diferentes grades da hierarquia, mas uma segunda estratégia é a escolha de-->
Quando associamos as células de uma grade a uma grandeza, tal como população, podemos escolher conjuntos de células contíguas que proporcionem uma distribuição uniforme da grandeza. Os conjuntos podem ser identificados de duas forma:
Quando associamos as células de uma grade uma grandeza, tal como população, podemos escolher conjuntos de células contíguas que proporcionem uma distribuição uniforme da grandeza. Os conjuntos podem ser identificados de duas forma:


# Pelo geocódigo da célula-mãe:  geocódigo resultante do prefixo comum das células do conjunto.  
# Pelo geocódigo da célula-mãe:  geocódigo resultante do prefixo comum das células do conjunto.  
# Por um intervalo de geocódigos de células vizinhas: dois geocódigos, da primeira e da última célula do intervalo.
# Por um intervalo de geocódigos de células vizinhas: dois geocódigos, da primeira e da última célula do intervalo.


A segunda forma, além de poder ser usada com a primeira, proporciona maior flexibilidade, portanto garantia maior de balanceamento. No exemplo, a garantia de que a soma da população resultante em diferentes intervalos terá aproximadamente a mesma. Por conterem todos aproximadamente o mesmo valor total da grandeza distribuída pelas suas células, dizemos que são ''partições''. Uma aplicação importante em computação a distribuição equilibrada do consumo de disco (volume em bytes) pelas partições, a escolha adequada dos intervalos resulta em um bom ''balanceamento de carga'' entre as partições. Em uma tabela de pontos de endereço, por exemplo, podemos esperar que a quantidade de pontos por partição será aproximadamente a mesma.
A segunda forma, além de poder ser usada com a primeira, proporciona maior flexibilidade, portanto garantia maior de balanceamento. No exemplo, a garantia de que a soma da população resultante em diferentes intervalos terá aproximadamente a mesma. Por conterem todos aproximadamente o mesmo valor total da grandeza distribuída pelas suas células, dizemos que são ''partições''. Fisicamente cada partição estará armazenada em um mesmo arquivo [[Apache_Parquet#Partição|Parquet]] ou [[GeoJSON#Partição_em_git|GeoJSON]].
 
Uma aplicação importante em computação é a distribuição equilibrada do consumo de disco (volume em bytes) pelas partições. A escolha adequada dos intervalos resulta em um bom ''balanceamento de carga'' entre as partições. Em uma tabela de pontos de endereço, por exemplo, podemos esperar que a quantidade de pontos por partição será aproximadamente a mesma. Como o registro de cada ponto consome uma quantidade fixa de bytes, temos também um bom balanceamento de carga.


Outras aplicações, tais como definição de setores territoriais na gestão pública, podem também fazer uso de intervalos.
Outras aplicações, tais como definição de setores territoriais na gestão pública, podem também fazer uso de intervalos.