Nižšie je moje požiadavky na vzorku
Chcem zákazníkov, ktorí spĺňajú všetky podmienky nižšie
- V krajine "xyz", začlenený medzi 2019 až 2021.
- Mali by mať aspoň jeden účet s rovnováhu medzi 10000 a 13000 a pobočka je "abc" a transakcie dátumy medzi 20200110 a 20210625. To je naformátovaný a uložené ako čísla
- Mali by mať aspoň jednu adresu v štáte "state1" a pin kódy medzi 625001 a 625015
Nižšie je tabuľka štruktúra
CREATE TABLE IF NOT EXISTS customer_search_ms.customer
(
customer_id integer,
customer_details jsonb
)
Tam môže byť milióny riadkov v tabuľke. Vytvoril som GIN index typ jsonb_ops na customer_details stĺpci, ako by sme byť tiež kontrola na existenciu podmienky a rozsah porovnanie
Nižšie je ukážka údajov v customer_data JSONB stĺpec
customer_id : 1
{
"customer_data": {
"name": "abc",
"incorporated_year": 2020,
"country":"xyz",
"account_details": [
{
"transaction_dates": [
20180125, 20190125, 20200125,20200525
],
"account_id": 1016084,
"account_balance": 2000,
"account_branch": "xyz"
},
{
"transaction_dates": [
20180125, 20190125, 20200125
],
"account_id": 1016087,
"account_balance": 12010,
"account_branch": "abc"
}
],
"address": [
{
"address_id": 24739,
"door_no": 4686467,
"street_name":"street1",
"city": "city1",
"state": "state1",
"pin_code": 625001
},
{
"address_id": 24730,
"door_no": 4686442,
"street_name":"street2",
"city": "city1",
"state": "state1",
"pin_code": 625014
}
]
}
}
Teraz dotaz som napísal vyššie, je
SELECT c.customer_id,
c.customer_details
FROM customer_search_ms.customer c
WHERE c.customer_details @@ CAST('$.customer_data.country == "xyz" && $.customer_data.incorporated_year >= 2019 && $.customer_data.incorporated_year <= 2021 ' AS JSONPATH)
AND c.customer_details @? CAST('$.customer_data.account_details[*] ? (@.account_balance >= 10000) ? (@.account_balance <= 13000) ?(@.account_branch == "abc") ? (@.transaction_dates >= 20200110) ? (@.transaction_dates <= 20210625)' AS JSONPATH)
AND c.customer_details @? CAST('$.customer_data.address[*] ? (@.state == "state1") ? (@.pin_code >= 625001) ? (@.pin_code <= 625015) ' AS JSONPATH)
Zvládnuť vyššie scenár je to najlepší spôsob, ako písať. Je možné kombinovať všetky 3 kritériá to (customer/account/adresa) do jedného výrazu? Tabuľka bude mať milióny riadkov. Zastávam názor, mať ju ako jeden výraz a biť DB sa bude dať čo najlepší výkon. Je možné kombinovať tieto 3 podmienky ako jeden výraz