Samouczek DBMS dla początkujących: wszystko, co musisz wiedzieć

Opublikowany: 2022-09-07

Zanim zaczniemy zapoznawać się z systemami zarządzania bazami danych (DBMS) w tym samouczku dotyczącym DBMS , konieczne jest dokładne zrozumienie baz danych.

Załóżmy, że pracujesz dla międzynarodowej firmy zatrudniającej około kilku tysięcy pracowników rozsianych po całym świecie. Każdemu pracownikowi zostanie przydzielony niepowtarzalny identyfikator pracownika, stanowisko, kierownika, data „zatrudnienia” i „wypowiedzenia umowy” oraz konkretna kwota wynagrodzenia. Ponieważ tworzenie tabel, kategoryzacja danych i zapisywanie tysiąca pozycji na kartce nie jest wykonalne, bazy danych powstały w latach 60. XX wieku.

Przejdźmy dalej z tym samouczkiem DBMS , abyś mógł szybko zrozumieć podstawowe pojęcia.

Spis treści

Co to jest system zarządzania bazą danych (DBMS)?

Być może słyszałeś o MongoDB, Cassandra, OracleSQL lub MySQL. To tylko kilka z wielu dostępnych DBMS. Programy te umożliwiają zapisywanie danych, ich pobieranie i przeszukiwanie baz danych.

Baza danych to cyfrowa reprezentacja „pojedynczej długiej kartki papieru”. Może być segmentowany, powiązany z inną bazą danych, sortowany według różnych czynników, a nawet porównywany ze sobą.

Rozważ następujący scenariusz: chcesz przeanalizować pensje osób o tym samym stanowisku pracy i latach doświadczenia zawodowego. Jedyną istotną różnicą jest to, że działają w różnych krajach. Możesz przeprowadzić tę analizę za pomocą DBMS lub systemu zarządzania bazami danych.

Zapoznaj się z naszymi popularnymi kursami z zakresu nauki o danych

Executive Post Graduate Program in Data Science z IIITB Profesjonalny program certyfikatów w dziedzinie nauki o danych do podejmowania decyzji biznesowych Master of Science in Data Science z University of Arizona
Zaawansowany program certyfikacji w dziedzinie nauki o danych z IIITB Profesjonalny program certyfikacji w dziedzinie nauki o danych i analityki biznesowej Uniwersytetu Maryland Kursy z nauki o danych

Rodzaje systemów zarządzania bazami danych

Systemy zarządzania bazami danych można podzielić na dwa typy:

  • Systemy zarządzania relacyjnymi bazami danych: Relacyjna baza danych to magazyn danych, który organizuje dane w połączone tabele, jak sama nazwa wskazuje. Strukturalny język zapytań (SQL) leży u podstaw tych systemów, ponieważ jest używany do komunikowania się z tymi bazami danych i administrowania nimi, co daje początek ich drugiemu monikerowi — bazom danych SQL.

W relacyjnych bazach danych dane są przechowywane w wierszach (rekordach) i kolumnach (atrybutach), które są zgodne z określonym modelem (inaczej schematem), zapewniając logiczną organizację danych. Ogólnie rzecz biorąc, w każdym rekordzie istnieje jedna wartość dla każdej właściwości, tworząc oczywiste relacje między różnymi punktami danych.

  • Nierelacyjne systemy zarządzania: Nierelacyjna baza danych nie jest tabelaryczna. Wykorzystuje różnorodne modele danych do zapisywania, organizowania i pozyskiwania informacji. Nazywa się je bazami danych NoSQL, ponieważ nie są ograniczone do struktury tabeli.

Umożliwiają przechowywanie nieustrukturyzowanych materiałów, takich jak teksty, obrazy i różne inne typy plików. Jednak w przeciwieństwie do relacyjnej bazy danych dane niekoniecznie są zorganizowane w wiersze i kolumny, tak jak w systemie plików płaskich.

Czym są klucze w DBMS?

Klucze służą do jednoznacznej identyfikacji poszczególnych rekordów lub wierszy danych w tabeli. Pomagają również w tworzeniu i identyfikacji powiązań między wierszami tabeli.

Różne rodzaje kluczy:

  • Klucz podstawowy: Ten klucz służy do identyfikowania pojedynczego wystąpienia obiektu. Każdy schemat ma tylko jeden klucz podstawowy. Ten klucz może być wartością lub ciągiem, który nie powtarza się więcej niż raz w całej tabeli. Na przykład identyfikator pracownika jest kluczem podstawowym tabeli wynagrodzeń lub schematu pracowników. Identyfikator pracownika jest unikalny i żaden z dwóch pracowników nie będzie miał tego samego identyfikatora pracownika.
  • Klucz obcy: klucze obce to kolumny w tabeli używane do odwoływania się do klucza podstawowego innej tabeli. Klucz obcy może również służyć jako klucz podstawowy dla innej tabeli.
  • Klucz złożony: Gdy klucz podstawowy ma wiele atrybutów (więcej niż jeden), jest nazywany kluczem złożonym.
  • Klucz kandydujący: z wyjątkiem klucza podstawowego wszystkie inne właściwości są uważane za klucze kandydujące.
  • Super klucz: Super klucz to zbiór atrybutów służący do jednoznacznej identyfikacji krotki.

Sprawdź nasze kursy nauki o danych, aby podnieść swoje umiejętności.

Podstawowe polecenia SQL do zarządzania bazami danych

Polecenia SQL to zbiór wytycznych. Służy do wymiany informacji z bazami danych. Poza tym służy również do przeprowadzania określonych czynności, procedur i wyszukiwania danych.

Najczęściej używane polecenia SQL wyjaśniono poniżej:

  • Język definicji danych (DDL): Język DDL jest używany do tworzenia lub edytowania obiektów bazy danych lub struktury bazy danych lub, ujmując to w inny sposób, do „definiowania” obiektów lub struktury bazy danych.
  • CREATE: W bazie danych polecenie „CREATE” tworzy nowe tabele.
  • ALTER: Polecenie „ALTER” służy do dodawania nowych kolumn lub atrybutów do tabeli lub do modyfikowania wartości już istniejących.
  • TRUNCATE: Polecenie „TRUNCATE” służy do usunięcia wszystkich wierszy z tabeli i oczyszczenia dostępnego miejsca w konkretnym schemacie, z którym pracujesz.
  • DROP: Polecenie „DROP” służy do usuwania lub „DROP” struktury i rekordów, które zostały zapisane w schemacie.
  • Język manipulacji danymi (DML): DML służy do modyfikowania baz danych zgodnie z życzeniem użytkownika poprzez wykonywanie zapytań w bazie danych. Są to najczęściej używane polecenia podczas pracy z bazami danych. Dane można zmienić, dodając lub usuwając wartości z bazy danych oraz zmieniając wartości już obecne w bazie danych.
    • INSERT: To polecenie służy do wprowadzania lub „INSERT” danych do wiersza tabeli lub schematu.
    • UPDATE: To polecenie służy do „AKTUALIZACJI” wartości kolumny tabeli lub schematu.
    • DELETE: To polecenie usuwa lub usuwa wiersze z tabeli. Polecenie DELETE można połączyć z poleceniem „GDZIE”, aby usunąć więcej niż jeden wiersz.
  • Język kontroli danych (DCL): DCL określa, w jaki sposób użytkownicy mogą uzyskać dostęp do informacji przechowywanych w bazie danych. Na przykład, jeśli w bazie danych pracuje 50 użytkowników, Administrator Bazy Danych może przyznać lub odebrać inżynierom dostęp do pewnych obszarów bazy danych.
    • GRANT: Prawa dostępu zapewniają użytkownikowi dostęp do bazy danych za pomocą polecenia „GRANT”.
    • REVOKE: Jest to w zasadzie przeciwieństwo polecenia „GRANT”. Usuwa uprawnienia użytkownika z jednego lub więcej schematów lub tabel.
  • Język kontroli transakcji (TCL): Język TCL służy do zapewnienia spójności bazy danych i obsługi transakcji inicjowanych przez polecenia języka manipulacji danymi (DML).
    • COMMIT: To polecenie służy do zapisywania aktualnego stanu bazy danych po wykonaniu wymaganych zapytań.
    • ROLLBACK: To polecenie służy do powrotu do punktu wszystkich niezapisanych zmian w schemacie.
    • SAVEPOINT: To polecenie służy do cofnięcia do określonego punktu w czasie bez konieczności cofania całej transakcji w całości.

Najlepsze umiejętności w zakresie analizy danych do nauki w 2022 r.

SL. Nie Najlepsze umiejętności w zakresie analizy danych do nauki w 2022 r.
1 Kurs analizy danych Kursy na temat statystyki wnioskowania
2 Programy testowania hipotez Kursy regresji logistycznej
3 Kursy regresji liniowej Algebra liniowa do analizy

Wniosek

Wraz z rozwojem postępu technologicznego w biznesie wzrasta zapotrzebowanie na wysoko wykwalifikowanych pracowników zorientowanych na dane. Z powodu zwiększonego popytu rywalizacja staje się zaostrzona. Analitycy i analitycy danych z solidnymi podstawami w dziedzinie nauki danych są bardzo poszukiwani zarówno przez duże, jak i małe firmy. Muszą być na bieżąco z systemami zarządzania danymi dostępnymi na rynku.

Ten samouczek dotyczący bazy danych to dopiero początek Twojej przygody z nauką. Z tytułem Master of Science in Data Science firmy upGrad możesz zagłębić się w świat nauki o danych. Kurs jest oferowany we współpracy z IIIT-B i Liverpool John Moore's University, jednym z wiodących indyjskich instytutów badawczych.

Uczniowie mają możliwość nawiązania kontaktu z profesjonalistami w tej dziedzinie oraz zdobycia wiedzy i umiejętności w zakresie najnowocześniejszych technologii i trendów branżowych, uczestnicząc w praktycznych zajęciach edukacyjnych i sesjach z nauczycielami.

Jakie są kryteria kwalifikacyjne do programu Master of Data Science z upGrad?

Do przyjęcia wymagany jest tytuł licencjata z minimalną średnią ocen wynoszącą co najmniej 50 procent. Ten kurs może wziąć udział każdy, niezależnie od poziomu doświadczenia w kodowaniu.

Co to jest DBMS?

System zarządzania bazą danych (lub DBMS) to skomputeryzowany system przechowywania danych.

Ile specjalizacji oferuje program Master of Data Science UpGrad?

Program oferuje łącznie sześć specjalizacji.