PostgreSQL
Server
Wir haben pro Host einen einzelnen PostgreSQL-Datenbankserver. Der Zugriff erfolgt über den Hostnamen localhost und den Port 5432. PostgreSQL unterstützt auch eine Verbindung über einen Socket. Dies wird bei uns für administrative Arbeiten genutzt, da hierüber per Konfiguration eine Verbindung ohne Passwortabfrage zugelassen wird. Dementsprechend steht diese Möglichkeit nicht für normale User zur Verfügung.
Keine default DB_User und DB_Datenbank
Auf dem Server werden per Default keine Accounts oder Datenbanken für ein Paket angelegt. Der Paketadmin muss dies mit dem Tool hsadmin vornehmen, da das CREATEDB- und CREATEUSER-Recht nicht an normale Useraccounts vergeben wird.Dabei ist zu beachten, dass sowohl Benutzer- als auch Datenbanknamen mit dem Paketkürzel ( xyz00_ ) anfangen müssen, also z.B. xyz00_datenbank
und xyz00_datenbankuser
.
Keine Beziehung
Zwischen den Accounts xyz00/xyz00-bla (Shell) und xyz00/xyz00_bla (PgSQL) besteht keine Beziehung.
PostgreSQL-User
Paketadmin
Der Paketadmin hat mit seinem Account sehr weitgehende administrative Rechte und sollte dementsprechend mit Umsicht genutzt werden. Er kann mit seinem Account mit Hilfe von hsadmin:
- Datenbanken anlegen und löschen
- Benutzer anlegen und löschen
Benutzer anlegen
Du musst Dir vor dem Anlegen einer Datenbank mindestens einen Benutzer für PostgreSQL anlegen. Wir empfehlen für jede Anwendung eine eigene Datenbank mit jeweils eigenem Datenbank-Benutzer. Für einzelne Aufgaben kannst Du neben dem Datenbank-Administrator noch weitere Benutzer anlegen, denen Du natürlich verschiedene Rechte geben kannst, z.B. nur Rechte an bestimmten Tabellen oder zur Ausführung bestimmter Kommandos.
Wir legen einen User an:
siehe Datenbanken
Datenbank anlegen
Eine neue Datenbank muss in PostgreSQL mit dem Tool hsadmin, beschrieben unter Datenbanken, angelegt werden.
Der PostgreSQL-Monitor
Für die interaktive Verbindung zu einer Datenbank wird bei PostgreSQL das Programm psql
verwendet. Nachdem ein User und eine Datenbank angelegt wurden, kann eine erste Verbindung zu PostgreSQL aufgebaut werden:
xyz00@hopi$ psql --host localhost --username xyz00_benutzer --dbname xyz00_datenbank Password: passwort Welcome to psql, the PostgreSQL interactive terminal. Type: \copyright for distribution terms \h for help with SQL commands \? for help on internal slash commands \g or terminate with semicolon to execute query \q to quit SSL connection (cipher: DES-CBC3-SHA, bits: 168) xyz00_datenbank=>
Nun können wir PostgreSQL-Befehle eingeben. Zu beachten ist, dass die Zeilen mit ';'
abgeschlossen werden müssen.
Von psql
und einigen anderen Tools werden eine Reihe von Umgebungsvariablen ausgewertet, so dass für die Anmeldung bei der Datenbank nicht immer alle Verbindungsdaten eingetippt werden müssen. Dazu gehören PGDATABASE
, PGHOST
, PGPORT
und PGUSER
. Man kann diese Variablen z.B. in seinem Shell-Profile setzen und damit die Anmeldung vereinfachen. Bei /bin/bash
als Shell sieht das so aus:
PGHOST=localhost PGUSER=xyz00_benutzer PGDATABASE=xyz00_datenbank export PGHOST PGUSER PGDATABASE
Benutzer- und Datenbankname sollten natürlich an das eigene Paket angepasst werden. Anschließend reicht der einfache Aufruf von psql
, um eine Verbindung zu dieser Datenbank mit dem angegebenen Benutzernamen aufzubauen.
Ändern des Passworts
Nach dem Anmelden in psql
als der jeweilige Benutzer kann das Passwort folgendermaßen geändert werden:
xyz00_test=> ALTER USER xyz00_benutzer WITH PASSWORD 'neuespasswort';
Backups
Für Backup und Restore werden die beiden Programme pg_dump
und pg_restore
verwendet. Damit kann auch der Paketadmin eigene Sicherungen anlegen und zurückspielen oder auch eine Datenbank von seiner Entwicklungsumgebung einspielen.
Von den PostgreSQL-Datenbanken wird einmal pro Nacht eine Sicherung mit pg_dump angefertigt, die im Backup-Verzeichnis des Paketes abgelegt wird. Die Sicherung erfolgt mit dem folgenden Kommando:
xyz00@hopi:~$ pg_dump --blobs --format=c xyz00_datenbank
Der Dump wird dann mit gzip
komprimiert und unter dem Namen der jeweiligen Datenbank unter ~/.bak
angelegt.
Vacuum einer Datenbank
Das Aufräumen einer PostgreSQL-Datenbank hat zwei Ziele:
- Ermittlung von Tabellenstatistiken (Größe, Anzahl Datensätze, Werteverteilung), damit der SQL-Optimizer einen möglichst guten Ausführungsplan berechnen kann.
- Freigeben von nicht mehr genutzen Blöcken, die durch Löschen und Ändern von Datensätzen entstanden sind.
Zur Durchführung dieser Aktionen kann das SQL-Kommando vacuum
oder das Unix-Kommando vacuumdb
benutzt werden.
Bei uns läuft einmal pro Nacht ein VACUUM ANALYZE
zur Aktualisierung der Statistiken.
Es wird empfohlen, dass nach dem Ändern oder Löschen von größeren Datenmengen ein VACUUM FULL
auf der Datenbank ausgeführt wird. Damit wird der benötigte Platz reduziert und im Allgemeinen auch die Zugriffsperformance verbessert. Da dieses Kommando für die Laufzeit eine exklusive Sperre auf den Tabellen hält, kann dies leider nicht regelmäßig und automatisiert laufen, sondern muss vom Anwender selbst ausgeführt werden.
Links
Verschiedenes
- Web-Frontend: phpPgAdmin ist unter https://phppgadmin.hostsharing.net/current erreichbar.
- Online-Dokumentation: Die Online-Doku gibt es unter http://www.postgresql.org/docs/manuals/. Eine Liste von Büchern (einige davon zum Download) unter http://www.postgresql.org/docs/books/.