PostgreSQL: Unterschied zwischen den Versionen

Aus Hostsharing Wiki
Zur Navigation springen Zur Suche springen
(Glossar)
(Kategorien)
Zeile 123: Zeile 123:
[[Kategorie:HSDoku]]
[[Kategorie:HSDoku]]
[[Kategorie:Datenbanken]]
[[Kategorie:Datenbanken]]
[[Kategorie:Datenbanken:Postgresq]]
[[Kategorie:Glossar]]
[[Kategorie:Glossar]]

Version vom 28. Juni 2009, 16:13 Uhr

Server

Wir haben pro Host einen einzelnen PostgreSQL-Datenbankserver. Der Zugriff erfolgt über den Hostnamen localhost und den Port 5432. PostgreSQL unterstützt auch eine Verbindung über einen Socket. Dies wird bei uns für administrative Arbeiten genutzt, da hierüber per Konfiguration eine Verbindung ohne Passwortabfrage zugelassen wird. Dementsprechend steht diese Möglichkeit nicht für normale User zur Verfügung.

Auf dem Server werden per Default keine Accounts oder Datenbanken für ein Paket angelegt. Der Paketadmin muss dies mit dem Tool DBAdmin vornehmen, da das CREATEDB- und CREATEUSER-Recht nicht an normale Useraccounts vergeben wird.

Dabei ist zu beachten, dass sowohl Benutzer- als auch Datenbanknamen mit dem Paketkürzel anfangen müssen, also z.B. xyz00_datenbank und xyz00_datenbankuser. Andere Namen sind nicht möglich.

PostgreSQL-User

Paketadmin

Der Paketadmin hat mit seinem Account sehr weitgehende administrative Rechte und sollte dementsprechend mit Umsicht genutzt werden. Er kann mit seinem Account unter anderem:

  • Datenbanken anlegen und löschen
  • Benutzer anlegen und löschen
  • Rechte an Benutzer vergeben

Bevor man in seinem Paket PostgreSQL benutzen kann, muss man als ersten Schritt einen Zugang für den Paketadmin einrichten. Das ist zwingend notwendig. Der PostgreSQL-User mit dem Kürzel des Paketadmins (xyz00) besitzt automatisch alle Rechte an allen Datenbanken des Paketes, er ist also sehr mächtig. Wir müssen den User mit dbadmin einrichten.

xyz00@hopi$ dbadmin -a -i pgsql -u xyz00
Password: password
User 'xyz00' created.

Der Benutzername des Paketadmins für PostgreSQL entspricht dem Benutzernamen des Paketadmins für den Zugang zum Server. Das ist eine von uns gewählte Konvention, damit Du Dir den Namen für den PostgreSQL-Zugang leichter merken kannst. Grundsätzlich stehen die Benutzernamen für PostgreSQL in keiner Beziehung zu den Benutzernamen für die Server.

Weitere Benutzer anlegen

Du kannst Dir weitere Benutzer für PostgreSQL anlegen. Wir empfehlen Dir das ausdrücklich, weil es eine gute Idee ist, den mächtigen Zugang des Paketadmins nur für administrative Zwecke zu benutzen. Schließlich will man nicht immer den mächtigen Account des Paketadmins in seinen Skripten verwenden. Für einzelne Aufgaben kannst Du verschiedene Benutzer anlegen, denen Du natürlich auch verschiedene Rechte geben kannst, z.B. nur Rechte an bestimmten Datenbanken oder zur Ausführung bestimmter Kommandos.

Wir legen noch einen User an:

xyz00@hopi$ dbadmin -a -i pgsql -u xyz00_otto
Password: password
User 'xyz00_otto' created.

mehr Information zum Anlegen von Nutzern im Artikel dbadmin

Datenbank anlegen

Eine neue Datenbank muss in PostgreSQL mit dem Tool dbadmin angelegt werden.

xyz00@hopi:~$ dbadmin -c -i pgsql -n xyz00_datenbank


Der PostgreSQL-Monitor

Für die interaktive Verbindung zu einer Datenbank wird bei PostgreSQL das Programm psql verwendet. Nachdem ein User und eine Datenbank angelegt wurden, kann eine erste Verbindung zu PostgreSQL aufgebaut werden:

xyz00@hopi$ psql --host localhost --username xyz00 --dbname xyz00_datenbank
Password: passwort
Welcome to psql, the PostgreSQL interactive terminal.

Type: \copyright for distribution terms
\h for help with SQL commands
\? for help on internal slash commands
\g or terminate with semicolon to execute query
\q to quit

SSL connection (cipher: DES-CBC3-SHA, bits: 168)

xyz00_datenbank=>

Nun können wir PostgreSQL-Befehle eingeben. Zu beachten ist, dass die Zeilen mit ';' abgeschlossen werden müssen.

Von psql und einigen anderen Tools werden eine Reihe von Umgebungsvariablen ausgewertet, so dass für die Anmeldung bei der Datenbank nicht immer alle Verbindungsdaten eingetippt werden müssen. Dazu gehören PGDATABASE, PGHOST, PGPORT und PGUSER. Man kann diese Variablen z.B. in seinem Shell-Profile setzen und damit die Anmeldung vereinfachen. Bei /bin/bash als Shell sieht das so aus:

PGHOST=localhost
PGUSER=xyz00
PGDATABASE=xyz00_datenbank
export PGHOST PGUSER PGDATABASE

Benutzer- und Datenbankname sollten natürlich an das eigene Paket angepasst werden. Anschließend reicht der einfache Aufruf von psql, um eine Verbindung zu dieser Datenbank mit dem angegebenen Benutzernamen aufzubauen.

Ändern des Passworts

Nach dem Anmelden in psql als der jeweilige Benutzer kann das Passwort folgendermaßen geändert werden:

xyz00_test=> ALTER USER xyz00 WITH PASSWORD 'neuespasswort';

Backups

Für Backup und Restore werden die beiden Programme pg_dump und pg_restore verwendet. Damit kann auch der Paketadmin eigene Sicherungen anlegen und zurückspielen oder auch eine Datenbank von seiner Entwicklungsumgebung einspielen.

Von den PostgreSQL-Datenbanken wird einmal pro Nacht eine Sicherung mit pg_dump angefertigt, die im Backup-Verzeichnis des Paketes abgelegt wird. Die Sicherung erfolgt mit dem folgenden Kommando:

xyz00@hopi:~$ pg_dump --blobs --format=c xyz00_datenbank

Der Dump wird dann mit gzip komprimiert und unter dem Namen der jeweiligen Datenbank unter ~/.bak angelegt.

Vacuum einer Datenbank

Das Aufräumen einer PostgreSQL-Datenbank hat zwei Ziele:

  • Ermittlung von Tabellenstatistiken (Größe, Anzahl Datensätze, Werteverteilung), damit der SQL-Optimizer einen möglichst guten Ausführungsplan berechnen kann.
  • Freigeben von nicht mehr genutzen Blöcken, die durch Löschen und Ändern von Datensätzen entstanden sind.

Zur Durchführung dieser Aktionen kann das SQL-Kommando vacuum oder das Unix-Kommando vacuumdb benutzt werden.

Bei uns läuft einmal pro Nacht ein VACUUM ANALYZE zur Aktualisierung der Statistiken.

Es wird empfohlen, dass nach dem Ändern oder Löschen von größeren Datenmengen ein VACUUM FULL auf der Datenbank ausgeführt wird. Damit wird der benötigte Platz reduziert und im Allgemeinen auch die Zugriffsperformance verbessert. Da dieses Kommando für die Laufzeit eine exklusive Sperre auf den Tabellen hält, kann dies leider nicht regelmäßig und automatisiert laufen, sondern muss vom Anwender selbst ausgeführt werden. Links

Verschiedenes