Banco de dados
Bancos de dados (português brasileiro) ou bases de dados (português europeu) são conjuntos de arquivos relacionados, normalmente contendo registros sobre pessoas, lugares ou informações em geral. Esses conjuntos são coleções organizadas de dados, que podem estar inter-relacionados ou não, com o objetivo de armazenar informações. Os bancos de dados tornaram-se a principal fonte de dados para sistemas de informação e segurança. Normalmente, eles permanecem por muitos anos sem alterações significativas em sua estrutura sistemática.[1][2][3][4][5] Os bancos de dados são operados por Sistemas Gerenciadores de Bancos de Dados (SGBD), que surgiram na década de 1970.[6][7] Antes do advento desses sistemas, as aplicações utilizavam os sistemas de arquivos do sistema operacional para armazenar suas informações.[7][8] Na década de 1980, a tecnologia de SGBDs relacionais passou a dominar o mercado e, atualmente, é amplamente utilizada em praticamente todos os bancos de dados.[6][7] Outro tipo notável é o SGBD orientado a objetos, implementado em bancos de dados com estruturas complexas ou aplicações que mudam constantemente.[3] Alguns dos mais usados atualmente incluem o MySQL, Oracle, PostgreSQL, Microsoft SQL Server, SQLite, entre outros sistemas que gerenciam bases de dados. A principal aplicação dos banco de dados é o controle de operações empresariais, normalmente armazenando dados relevantes para a gestão de um negócio, como dados de clientes, funcionários, fornecedores e outras informações.[9][10] Outra aplicação importante é o gerenciamento de informações de estudos, como fazem os Bancos de Dados Geográficos, que unem informações como mapas, imagens de satélite, pontos, linhas, áreas, entre outros dados geográficos.[11] No aspecto de segurança da informação, os bancos de dados precisam garantir a privacidade dos dados neles armazenados. É importante construir camadas que gerenciem quais informações podem ou não ser acessadas pelos usuários. Se usuários não autorizados tiverem acesso a dados sensíveis, ultrapassando a fronteira de informação que podem acessar, isso fere o princípio da confidencialidade. HistóriaDiante da necessidade humana de registrar os eventos e informações relevantes, foram criadas diversas técnicas com esse fim. Técnicas como pinturas pré-históricas, hieróglifos, escrita cuneiforme e, posteriormente, a própria escrita alfabética, foram usadas como meios para registrar dados. Com a invenção do papel em meados de 105 d.C. e, no âmbito ocidental, da prensa móvel de Gutenberg, as tecnologias de impressão evoluíram muito, e, a partir do século XV, o papel passou a ser o meio físico mais comum de registro de informações. Essa herança fez com que no início da era computacional, se usasse o papel perfurado e, depois, o cartão perfurado em máquinas, ambos idealizados por Herman Hollerith, fundador da International Business Machines (IBM). A continuidade do papel no presente como um meio indispensável de armazenamento pode ser encontrada em bancos de dados não computadorizados, como ocorre com arquivos de aço, fichas e pastas. Entretanto, novos fatores que levaram ao desenvolvimento dos bancos de dados computadorizados foram a praticidade, eficiência, rapidez e confiabilidade do registro de informações em meios eletrônicos, em conjunto com o barateamento e disponibilidade de sua oferta. A origem dos programas de bancos de dados ocorreu de maneira síncrona ao surgimento dos computadores, tendo em vista que, antes mesmo do desenvolvimento de programas específicos para este uso, os computadores já utilizavam recursos de gravação e leitura de dados em disco. Apesar de cada aplicação ser responsável pelo gerenciamento de dados, alguns fatores dificultaram o seu uso, como:
Em sistemas orientados a arquivos, ocorre um fluxo de informações em duas vias, em que há interações entre o usuário e a aplicação, e a aplicação com o banco de dados, e vice-versa. Esses sistemas são conhecidos como sistemas de processamento de arquivos, pois não possuem estruturas de dados definidas no código-fonte, tornando sua manutenção muito difícil. Além disso, o compartilhamento de dados de um mesmo arquivo entre vários programas também é um problema, visto que todo fragmento de código responsável pela definição da estrutura de dados precisa necessariamente ser copiada para vários programas. Outro fator que dificultava a utilização de sistemas deste tipo era o método de acesso ao arquivo de dados, em que as rotinas de leitura e escrita estavam inseridas no próprio código-fonte, ocasionando um desalinhamento do padrão, visto que cada aplicação trabalhava de forma diferente em relação à metodologia de acesso dos arquivos. Em um sistema de banco de dados, os aplicativos não possuem nenhum conhecimento relacionado aos métodos de escrita e leitura dos dados nas tabelas; em vez disso, eles se comunicam com o software de gerenciamento para recuperar e armazenar registros, fazendo com que vários programas consigam acessar um mesmo banco de dados ao mesmo tempo, sem implicações nos aplicativos. Dessa forma, os sistemas gerenciadores de banco de dados (SGBDs) oferecem uma produtividade maior no desenvolvimento de softwares e aplicativos, proporcionando um nível mais alto de qualidade às aplicações. Uma das maiores vantagens de se utilizar um gerenciador de banco de dados é a confiabilidade das informações, devido à coerência em que se encontram os dados. Por ser um ótimo segmento e muito lucrativo, houve um grande investimento por parte do mercado em sistemas de gerenciamento e hoje existem diversas versões de banco de dados disponíveis em várias plataformas e sistemas operacionais. Nos dias de hoje, é indispensável o uso do banco de dados, uma vez que é possível encontrar inúmeras atividades que possuem alguma interação com eles, desde redes sociais até aplicativos de gerenciamento de produção.[12] Sistemas Gerenciadores de Banco de Dados (SGBDs) e seus modelosExistem vários modelos de bases de dados: Modelo Plano (ou tabular), Modelo de Memória Transacional, Modelo em Rede, Modelo Hierárquico, Modelo Relacional, Orientado a objetos e Objeto Relacional.
Bases de dados relacionaisDiferentemente dos modelos hierárquico e de rede, não existem quaisquer apontadores, de acordo com o Princípio da Informação: toda a informação deve ser representada como dados; qualquer tipo de atributo representa relações entre conjuntos de dados. As bases de dados relacionais permitem aos utilizadores (incluindo programadores) escrever consultas (queries) que não foram antecipadas por quem projetou a base de dados. Como resultado, bases de dados relacionais podem ser utilizadas por várias aplicações em formas que os projetistas originais não previram, o que é especialmente importante em bases de dados que são utilizadas por longos períodos. Isto torna as bases de dados relacionais muito populares no meio empresarial. O modelo relacional é uma teoria matemática desenvolvida por Edgar Frank Codd para descrever como as bases de dados devem funcionar. Embora esta teoria seja a base para o software de bases de dados relacionais, poucos sistemas de gestão de bases de dados seguem integralmente as 12 leis do modelo relacional. Todos têm funcionalidades que violam a teoria, desta forma variando a complexidade e o poder. A discussão se esses bancos de dados merecem ser chamados de relacional ficou esgotada à medida que os bancos de dados evoluíram. Os bancos de dados hoje implementam o modelo definido como objeto relacional. Os primeiros sistemas comerciais baseados no modelo relacional foram disponibilizados em 1980, e desde então ele foi implementado em muitos sistemas, tais como Access, Oracle, MySQL, PostgreSQL, entre outros.[13] Evoluções nos bancos de dados relacionaisNos últimos anos, os bancos de dados relacionais (RDBMS) passaram por várias evoluções significativas, impulsionadas por novas tecnologias e a crescente demanda por recursos mais avançados. Aqui estão algumas das principais tendências e desenvolvimentos:
Essas tendências indicam um futuro dinâmico para os bancos de dados relacionais, à medida que eles continuam a se integrar com novas tecnologias e a se adaptar às necessidades em evolução dos usuários. Se você quiser saber mais sobre esses desenvolvimentos, você pode conferir mais detalhes nas fontes citadas. Aplicações de bancos de dadosSistemas Gerenciadores de Bancos de Dados são usados em muitas aplicações, abrangendo virtualmente a gama inteira de software de computador. Os Sistemas Gerenciadores de Bancos de Dados são o método preferido de armazenamento e recuperação de dados/informações para aplicações multiusuários grandes, onde a coordenação entre os usuários é necessária.[15] Até mesmo usuários individuais os consideram convenientes, entretanto, muitos programas de correio eletrônico e organizadores pessoais estão baseados em tecnologia de banco de dados padrão. TransaçãoUma transação é um conjunto de procedimentos, executados num banco de dados, que o usuário percebe como uma única ação. A integridade de uma transação depende de quatro propriedades, conhecidas como ACID[16]:
A transação possui os seguintes estados:
Controle de concorrênciaControle de concorrência é um método usado para garantir que as transações sejam executadas de forma segura e sigam as regras ACID. Os SGBD devem ser capazes de assegurar que nenhuma ação de transações completadas com sucesso (committed transactions) seja perdida ao desfazer transações abortadas (rollback). Uma transação é uma unidade que preserva consistência. Requer-se, portanto, que qualquer escalonamento produzido ao processar um conjunto de transações concorrentemente seja computacionalmente equivalente a um escalonamento produzido executando essas transações serialmente em alguma ordem. Um sistema que garante esta propriedade assegura a serialização.[17] BloqueioEm vez de bloquear (blocking) um banco de dados inteiro, uma transação pode bloquear apenas os itens de dados que ela acessa. Sobre tal política, a transação precisa manter bloqueios por tempo suficiente para garantir a serialização, mas por um período curto o suficiente para não prejudicar o desempenho excessivamente.[18] SegurançaOs bancos de dados são utilizados para armazenar diversos tipos de informações, desde dados sobre uma conta de e-mail até dados importantes da Receita Federal. A segurança do banco de dados enfrenta as mesmas dificuldades que a segurança da informação enfrenta, que é garantir a integridade, a disponibilidade e a confidencialidade. Um sistema gerenciador de banco de dados deve fornecer mecanismos que auxiliem nesta tarefa. Uma forma comum de ataque à segurança do banco de dados é injeção de SQL, em bancos de dados que utilizam essa linguagem, mas bancos de dados NoSQL também podem ser vítimas. Para evitar estes ataques, o desenvolvedor de aplicações deve garantir que nenhuma entrada possa alterar a estrutura da consulta enviada ao sistema. Os bancos de dados SQL implementam mecanismos que restringem ou permitem acesso aos dados de acordo com papéis (roles) fornecidos pelo administrador. O comando GRANT concede privilégios específicos para um objeto (tabela, visão, banco de dados, função, linguagem procedimental, esquema ou espaço de tabelas) para um ou mais usuários ou grupos de usuários. FalhasEm um banco de dados podem ocorrer falhas: de transação, de sistema ou de mídia. A falha de transação, que é a mais comum, é aquela em que a transação é finalizada irregularmente, normalmente por falta de dados necessários ou programação equivocada. A falha de sistema, que tem probabilidade de ocorrência mediana, ocorre quando a execução do sistema é interrompida por causa de problemas como falta de energia, falha no hardware ou mau funcionamento do sistema operacional. Em uma falha de mídia, o banco de dados não fica plenamente acessível, fazendo com que parte do disco perca dados. Normalmente ocorre devido a disfunções na leitura ou partes do disco danificadas.[18] RecuperaçãoExistem alguns mecanismos capazes de permitir a recuperação de um banco de dados de algumas inconsistências causadas por falhas internas (erros de consistência, como recuperação de um estado anterior a uma transação que deu erro) e externas (queda de energia, catástrofe ambiental).[17] Entretanto, não é um método 100% seguro. Os mecanismos mais comuns são o Log de dados, que é usado em conjunto com outros métodos; utilização de Buffer no qual, apesar de normalmente ser feito pelo próprio sistema operacional, é controle por rotinas de baixo nível pelo Sistema de gerenciamento de banco de dados. Possui também as possibilidades de Write-ahead logging e informações das transações possibilitando o REDO (refazer) e o UNDO (desfazer), assim sempre possibilitando a volta do banco de dados a um estado anterior consistente, além de cópias de sombra dos logs e dos últimos dados alterados do banco de dados. Ações básicas da recuperação de banco de dados:
PesquisaA tecnologia de banco de dados tem sido um tópico de pesquisa ativo desde 1960, tanto na academia como nos grupos de pesquisa e desenvolvimento de empresas (por exemplo, IBM Research). A atividade de pesquisa inclui teoria e desenvolvimento de protótipos. Tópicos de pesquisa notáveis incluem modelos, o conceito de transação atômica e técnicas relacionadas ao controle de concorrência, linguagens de consulta e métodos de otimização de consulta, RAID e muito mais. A área de pesquisa de banco de dados tem vários periódicos acadêmicos dedicados (por exemplo, ACM Transactions on Database Systems - TODS, Data and Knowledge Engineering - DKE) e conferências anuais (por exemplo, ACM SIGMOD, ACM PODS, VLDB e IEEE ICDE). Funções internas comuns
Ver também
Referências
Ligações externas |