Folders and files

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
src		src
test		test
web		web
Makefile		Makefile
README.md		README.md
pgpro_scheduler--1.0.sql		pgpro_scheduler--1.0.sql
pgpro_scheduler.control		pgpro_scheduler.control

Repository files navigation

pgpro_scheduler - расширение PostgreSQL для управления расписанием задач

pgpro_scheduler это планировщик задач для СУБД PostgreSQL, который позволяетпланировать исполнение задач в базе и контроллировать их исполнение.

Задачи это наборы SQL команд. Расписание выполнения задач задается либо строкойcron, либо указанием конкретных дат запуска, либо JSON объектом, в которомуказывается в какие дни часы и минуты задача должна быть запущена. Возможнакомбинация методов описания расписания.

Каждая задача имеет возможность для вычисления времени следующего своегозапуска. Набор SQL команд в задаче может обрабатываться в разных транзакциях,по транзакции на команду, или в одной. В последнем случае имеется возможностьзадания SQL конманды, которая будет выполняться в случае аварийного завершениятранзакции.

Installation

pgpro_scheduler это расширение PostgreSQL и не тербует никаких специальныхпререквизитов.

Перед сборкой расширения из исходного кода убедитесь, что переменнаяокружения PATH содержит путь к командеpg_config. Так же убедитесь,что у вас установлена версия PostgresSQL для разработчиков или PostgreSQLсобран из исходного кода.

Процедура установки выглядит следующим образом:

$ cd pgpro_scheduler$ make USE_PGXS=1$ sudo make USE_PGXS=1 install$ psql <DBNAME> -c "CREATE EXTNESION pgpro_scheduler"

Конфигурация

Расширение определяет ряд переменных в PostgreSQL (GUC), которые позволяютуправлять его конфигурацией.

schedule.enable - двоичная переменная, которая поределяет разрешено ливыполнение расширения. По умолчанию: false.
schedule.database - строковая переменная, указывает с какими базам можетработать расширение. По умолчанию - пустая строка.
schedule.nodename - строковая переменная, содержит название узла.По умолчанию - master. Если расширение используется на одной машине,то переменная не имеет смысла.
schedule.max_workers - целочисленная переменная, содержит максимальноеколичество одновременно работающих задач для одной базы. По умолчанию - 2.
schedule.transaction_state - строковая переменная, устанавливаетсярасширением в процессе работы. По умолчанию - undefined. Переменнаяиспользуется для определения статуса завершения транзакции при вычисленииследующего времени выполнения задачи. Возможные значения:
- success - транзакция завершилась успешно
- failure - транзакция завершилась аварийно
- running - транзакция в процессе исполнения
- undefined - транзакция не началась
Последние два значения не должны попадать в процедуру определения следующегозначения. Это будет означать какую-то внутреннюю ошибку в работе расширения.

Управление

Управление работой планировщика задач осуществляется через переменныеPostgreSQL, которые описаны в предыдущем разделе.

Например, у вас существует свежая инсталляция PostgreSQL с установленнымрасширением планировщика. И вам требуется запустить планировщик на двухбазах database1 и database2. При этом вы хотите что бы планировщик длябазы database1 мог исполнять 5 задач одновременно, а для базы database2 - 3.

В $DATADIR/postgresql.conf должна присутствовать строка:

shared_preload_libraries = 'pgpro_scheduler'

Далее в psql введите следующие команды:

ALTER SYSTEM SET schedule.enable = true;ALTER SYSTEM SET schedule.database = 'database1,database2';ALTER DATABASE database1 SET schedule.max_workers = 5;ALTER DATABASE database2 SET schedule.max_workers = 3;SELECT pg_reload_conf();

Если вам не нужны указания различных значений для разных баз данных, то все этоможно занести в конфигурационный файл PostgreSQL и перечитать конфигурацию.Перезапуска не требуется.

Пример записей в$DATADIR/postgresql.conf, если количество одновременноисполняемых задач в обоих базах одинаково:

shared_preload_libraries = 'pgpro_scheduler'schedule.enable = onschedule.database = 'database1,database2'schedule.max_workers = 5

Планировщик задач работает с помощью Background Worker'ов. Поэтому должно бытьправильно установленно значение переменнойmax_worker_processes. Минимальноезначение переменной может быть расчитано по следующей формуле:

N_min = 1 + N_databases + MAX_WORKERS₁ + ... + MAX_WORKERS_n

Где:

N_min - это минимальное значение переменной, котороетребуется для работы конфигурации. Имейте в виду, что Background Workes'ымогут требоваться для работы других систем, например, параллельных запросов.
N_databases - это количество баз данных, для которыхзапускается планировщик.
MAX_WORKERS_n - это значение переменнойschedule.max_workersв контексте каждой базы данных, для которой запусткается планировщик.

SQL Schema

The extention creates aschedule schema. All functions, types and tables of extensionare defined within this scheme. Direct access to the tables created is forbiddento public. All actions should be done by means of sql interface functions.

SQL Types

Extension defines two SQL types and uses them as types of return valuesin interface functions.

CREATE TYPE schedule.cron_rec AS(id integer,             -- job record idnode text,              -- name of node name text,              -- name of the jobcomments text,          -- comment on jobrule jsonb,             -- rule of schedulecommands text[],        -- sql commands to executerun_as text,            -- name of the executor userowner text,             -- name of the owner userstart_date timestamp,   -- left bound of execution time window -- unbound if NULLend_date timestamp,     -- right bound of execution time window-- unbound if NULLuse_same_transaction boolean,   -- if true sequence of command executes -- in a single transactionlast_start_available interval,  -- time interval while command could -- be executed if it's impossible -- to start it at scheduled timemax_instances int,-- the number of instances run at the same timemax_run_time interval,  -- time interval - max execution time when -- elapsed - sequence of queries will be abortedonrollback text,        -- statement to be executed on ROLLBACKnext_time_statement text,   -- statement to be executed to calculate -- next execution timeactive boolean,         -- is job executes at that momentbroken boolean          -- if job is broken);CREATE TYPE schedule.cron_job AS(cron integer,           -- job record idnode text,              -- name of node scheduled_at timestamp, -- scheduled job timename text,              -- job namecomments text,          -- job commentscommands text[],        -- sql commands to executerun_as text,            -- name of the executor userowner text,             -- name of the owner useruse_same_transaction boolean,-- if true sequence of command executes-- in a single transactionstarted timestamp,      -- time when job startedlast_start_available timestamp,-- time untill job must be startedfinished timestamp,     -- time when job finishedmax_run_time interval,  -- max execution timemax_instances int,-- the number of instances run at the same timeonrollback text,        -- statement on ROLLBACKnext_time_statement text,-- statement to calculate next start timestatus text,             -- status of job: working, done, error message text             -- error message if one);