Mestrado em Sistemas Integrados de Apoio à Decisão / Business Intelligence (2ªEd-ISCTE-07/08)

sexta-feira, 19 de outubro de 2007

Quem inventou as matrizes multidimensionais?

Neste documento pretende-se tentar encontrar as raízes da modelação dimensional e das matrizes multidimensionais que são a base das bases de dados analíticas de hoje defendidas por Inmon e por Kimball.

Desde sempre que vivemos conscientes das três dimensões que nos rodeiam e aprendemos a viver com elas. A nossa experiencia forma o contexto em que analisamos e interpretamos o que observamos e quanto mais universais são as nossas percepções mais difícil é colocá-las em causa. Ninguém duvida que vivemos à custa de um mundo tridimensional, que pode ser representado pelas dimensões “esquerda-direita”, “frente-trás” e “cima-baixo”. Através da combinação destas três dimensões e de uma que aprendemos a considerar bastante mais tarde através do trabalho de Albert Einstein, o tempo, conseguimos definir-nos em relação ao que nos rodeia de forma clara e todos os dias o fazemos. Cada vez que combinamos um encontro, por exemplo, estamos a indicar as nossas 4 posições para nos definirmos em relação aos outros: “A minha casa fica na rua X, no número Y e no 3º andar” define as minhas 3 dimensões espaciais, mas para que o encontro seja eficaz temos de definir ainda a 4ª dimensão tempo: “Encontramo-nos às 10h20m”. Desta forma conseguimos definir através de dados onde estaremos naquele ponto da dimensão temporal.

Mas será que estas são as únicas dimensões que existem, ou estaremos simplesmente a sofrer de um paradigma universal que nos impede de ver para além do óbvio?

Em 1958, Arthur Cayley, um matemático britânico publicou, através de um trabalho intitulado “Memoir on the Theory of Matrices”, a primeira visão abstracta de matriz, compilando alguns trabalhos anteriores e desenvolvendo o conceito das matrizes de n-dimensões, utilizadas mais tarde por Heisenberg para o estudo do espaço-tempo contínuo, a noção de que o espaço e o tempo são inseparáveis.

Em 1919, um outro matemático Polaco pouco conhecido, chamado Theodor Kalusa, da Universidade de Conisberga, teve a coragem de desafiar o óbvio, sugerindo que o universo poderia ter, não três, nem quatro mas mais dimensões. De facto, a mera sugestão de que universo possa ter mais do que três dimensões pode parecer sem sentido, no entanto, se nos abstrairmos temporariamente do paradigma universal podemos tentar posicionar-nos num caso mais simples para explicar o crescimento lógico subjacente às multi-dimensões.

Se imaginarmos que alguns quilómetros de uma mangueira se encontram estendidos e suspensos num vale e que a vemos, a cerca de meio quilómetro de distância, conseguimos perceber facilmente que a mangueira é muito longa, fina como um fio e que está estendida horizontalmente, mas a não ser que tenhamos uma vista muito apurada, não conseguiremos discernir a espessura da mangueira. Poderemos imaginar que, se uma formiga fosse obrigada a viver na mangueira, teria de passar a vida a viver da esquerda para a direita” e para especificarmos a sua posição, teríamos apenas de fornecer um dado, o valor que indica a variável dessa dimensão. O ponto fundamental é que, a meio quilómetro a mangueira nos parece um objecto unidimensional. No entanto, a experiência indica-nos que uma mangueira tem espessura e se utilizarmos um binóculo para olhar mais de perto conseguimos começar a encontrar mais dimensões naquele objecto que julgávamos unidimensional.

Em 1919 Kalusa, e mais tarde em 1926 o sueco Oskar Klein sugeriram que o universo poderia ter dimensões escondidas, que escondiam dados que não estávamos preparados para analisar, a não ser que fizéssemos uma mudança de paradigma que nos permitisse observá-las.

A análise matricial multi-dimensional de dados, permite-nos ver além das 3 dimensões que estamos habituados a modelar facilmente, através dos cruzamentos das nossas operações neuronais, separando as camadas de informação que juntas, são o nosso universo de conhecimento.

Mais tarde, já em 1961, John K. Iliffe sugeriu uma forma de implementar matrizes multidimensionais em computação através do vector Iliffe (http://en.wikipedia.org/wiki/Iliffe_vector), uma estrutura de dados que se serve de apontadores para modelar várias dimensões de uma matriz.

Relativamente à aplicação da modelação dimensional na análise de dados, apesar de ser consensual que Bill Inmon é o pai do conceito de Data Warehouse, já a adopção da modelação dimensional como o standard de facto para a implementação de sistemas de apoio à decisão deve-se em grande parte e também a Ralph Kimball. Através da aplicação do modelo dimensional à análise de negócio, é possível ter uma visão abrangente, holística de todas as dimensões de uma organização, fazendo tal com sugerido por Kalusa e Klein, uma mudança do paradigma, neste caso, do simples processo de negócio para um nível mais abstracto, no qual é possível cruzar dados que, de outra forma, nos pareceriam impossíveis de relacionar.

por:

Fernanda Romão, João Guerreiro e Paulo Batista

1 comentário:

Zézinha_Trig disse...

Parabéns Pedro, gostei imenso dos teus artigos. Este especialmente ninguém tinha feito. Força