Código Natural/Identificação taxonômica/Casos de uso: mudanças entre as edições

De Documentação
Linha 32: Linha 32:
== Química ==
== Química ==
...
...
=== Taxonomia atômica ===
A [[wikipedia:Periodic table|tabela periódica]] ([https://www.todamateria.com.br/tabela-periodica/ ref. interativa português]) possui linhas ([[wikipedia:Period (periodic table)|períodos]]), colunas e uma classificação clássica por grupos.
Como o próprio nome diz, "periódica", essa seria a classificação mais importante, e de fato são apenas 7 períodos relevantes (numerados de 1 a 7) para a classificação atômica. Outra alternativa para a raiz da árvore seriam os [[wikipedia:Names for sets of chemical elements|conjuntos clássicos da IUPAC]], na ordem de ocorrência na tabela:
* Metais alcalinos (Alkali metals)
* Metais alcalino-terrosos (Alkaline earth metals)
* Não-metais
* Gases nobres (Noble gases)
* Semimetais
* Halogênios (Halogens)
* Metais de transição (transition elements)
* Outros metais (Pnictogens?)
* Lantanídeos (Rare-earth metals)
* Actinídios (Actinoids)
Em seguida a coluna, agrupada por [[wikipedia:Block (periodic table)|blocos]].
=== Taxonomia molecular ===
... orgânicos e não-orgânicos... depois uma extensa classificação, sem maior consenso. A industria farmacêutica, de qualquer forma, estabelece algumas convenções estáveis para produtos...
== Organizações do SchemaOrg ==
== Organizações do SchemaOrg ==
É muito comum em Big Data a adoção de uma visão unificada dos dados de uma grande empresa, que pode conter, por exemplo, mais de um [[wikipedia:Customer relationship management|sistema de CRM]] para a gestão dos seus clientes.
É muito comum em Big Data a adoção de uma visão unificada dos dados de uma grande empresa, que pode conter, por exemplo, mais de um [[wikipedia:Customer relationship management|sistema de CRM]] para a gestão dos seus clientes.

Edição das 11h54min de 5 de maio de 2024

Estruturas taxonômicas consensuais, e que sejam estáveis dentro de certa escala de tempo, não são tão raras. Existe alias, com as técnicas modernas de estatística, IA e taxonomia numérica, aliadas a um maior potencial de se medir as características de um objeto (desde informações IoT até DNA anulando risco de ambiguidade na atribuição de uma classe), uma tendência ao crescimento das taxonomias estáveis.

Biologia

Ramo do conhecimento que, historicamente, mais explorou e contribuiu para os fundamentos da Taxonomia. Não existe uma "taxonomia da vida" 100% consensual, mas, principalmente em função da aplicação, existem consensos e taxonomias estáveis.

Taxonavigation

Na comunidade gestora da Wikispecies houve consenso quanto à "navegação por taxon" (taxonavigation). São da ordem de 4 ramos na raiz da árvore, ou da ordem de 8 se incluirmos as subdivisões do reino Eukaryota:

  • Superregnum Archaea: códigos candidatos 0.
  • Superregnum Bacteria: códigos candidatos 1.
  • Superregnum Eukaryota: códigos candidatos 2 ou "".
    • Regnum Animalia: códigos candidatos 3 ou 20.
    • (Regnum Chromista: códigos candidatos 4 ou 21.)
    • Regnum Fungi: códigos candidatos 5 ou 22.
    • Regnum Plantae: códigos candidatos 6 ou 23.
    • Regnum Protista: códigos candidatos 7 ou 24.
  • (Virus: códigos candidatos 8 ou 3.)

Entre parêntesis os casos que foram colocados em dúvida, ou seja, que estão sujeitos a serem alterados, demandando reserva. A ordem dentro de cada ramos é arbitrária, quando possível seguindo a ordem alfabética dos nomes. A relevância, em termos de número de espécies e estabilidade, pode ser um critério para agregar "etc" como classe coringa, para casos exóticos e sem maior interesse (por exemplo para a Ecologia).

A escolha depende principalmente da necessidade ou não de se "economizar um dígito". Como a nomenclatura de reino é popular, por exemplo "Eukaryota Protista" (ou simplesmente "Protista") é razoável na raiz; sugere-se adotar a convenção de 1 dígito. A hierarquia de fato iniciaria depois deste primeiro dígito.

A escolha natural para esse primeiro dígito, com reserva, é de 4 bits (base16). A base do segundo dígito vai depender do primeiro, ou pode repetir a convenção dos 4 bits. Alguns exemplos:

Agroindústria

...

Química

...

Taxonomia atômica

A tabela periódica (ref. interativa português) possui linhas (períodos), colunas e uma classificação clássica por grupos.

Como o próprio nome diz, "periódica", essa seria a classificação mais importante, e de fato são apenas 7 períodos relevantes (numerados de 1 a 7) para a classificação atômica. Outra alternativa para a raiz da árvore seriam os conjuntos clássicos da IUPAC, na ordem de ocorrência na tabela:

  • Metais alcalinos (Alkali metals)
  • Metais alcalino-terrosos (Alkaline earth metals)
  • Não-metais
  • Gases nobres (Noble gases)
  • Semimetais
  • Halogênios (Halogens)
  • Metais de transição (transition elements)
  • Outros metais (Pnictogens?)
  • Lantanídeos (Rare-earth metals)
  • Actinídios (Actinoids)

Em seguida a coluna, agrupada por blocos.

Taxonomia molecular

... orgânicos e não-orgânicos... depois uma extensa classificação, sem maior consenso. A industria farmacêutica, de qualquer forma, estabelece algumas convenções estáveis para produtos...

Organizações do SchemaOrg

É muito comum em Big Data a adoção de uma visão unificada dos dados de uma grande empresa, que pode conter, por exemplo, mais de um sistema de CRM para a gestão dos seus clientes.

A classificação dos clientes B2B de uma empresa, conforme SchemaOrg.

O primeiro passo nesse caso é estabelecer em UML qual a estratégia semântica de unificação. Pode-se optar por exemplo por não misturar B2C com B2B, e optar por classificar os clientes B2B conforme o o primeiro e segundo níveis do padrão SchemaOrg, ou seja, conforme sch:Organization. Pode-se também reservar para o sistema interno, de RH por exemplo, a classe InternalOrganization, para mapear subsidiárias e departamentos.

Optou-se também por adotar, como medida de apoio à transição do ID convencional (inteiro de 32 bits) para o hInt de 64 bits, a classe Other. Nela os clientes com cadastro indefinido ou onde caberiam outras classificações, ficam de "quarentena". Na representação base16h seria necessário mais de um dígito para o primeiro e segundo níveis, de modo que uma opção mais amigável (1 dígito por nível hierárquico) é a base32nvu:

  • 0 - InternalOrganization (classe para a gestão interna de departamentos e empresas controladas)
  • 1 - (supor classe reservada)
  • 2 - Airline
  • 3 - Consortium
  • 4 - Corporation
  • ... (até 10 outras classificações futuras do SchemaOrg, ou obtidas na Wikidata)
  • Z - Other (classe temporária para a gestão de cadastros incompletos)
    • Z1 - Generic partner (para distinguir de terceirizados ou franquiados ainda indefinidos - sem especialização)

Devido à ambiguidade nos domínios, a empresa precisa definir qual a subclasse canônica, quando o SchemaOrg oferecer mais de uma alternativa. Por exemplo "Dentist" pode ser subclasse de "LocalBusiness" ou de "MedicalOrganization", no exemplo foi adotada a classe "MedicalOrganization".

Foram consumidos até aqui 15 dos 25 bits reservados à classificação (cada dígito base32 consome 5 bits - caberiam mais 2 dígitos), totalizando 25+32=57 bits informativos no esquema hInt64 de identificação das instâncias. Contador "por classe" de máximo 32 bits, pois, para usar o esquema hCount16_48, com 48 bits no contador, a classificação não poderia passar de 11 bits — acima poderíamos eliminar o terceiro nível para ficar com 10 bits.

Para a expressão final do ID de cada instância pode ser utilizado o código híbrido base32-decimal (ex. B5-123 seria a Pharmacy 123), ou base32 com ponto para destacar dígitos do contador (B5.3R).