Semi Join vs Bloom Join
Semi join un Bloom join ir divas savienošanas metodes, ko izmanto vaicājumu apstrādē izplatītām datu bāzēm. Apstrādājot vaicājumus sadalītajās datu bāzēs, dati ir jāpārsūta starp datu bāzēm, kas atrodas dažādās vietnēs. Tā varētu būt dārga darbība atkarībā no pārsūtāmo datu apjoma. Tāpēc, apstrādājot vaicājumus sadalītās datu bāzes vidē, ir svarīgi optimizēt vaicājumus, lai samazinātu datu apjomu, kas tiek pārsūtīts starp vietnēm. Semi join un bloom join ir divas metodes, ko var izmantot, lai samazinātu datu pārsūtīšanas apjomu un veiktu efektīvu vaicājumu apstrādi.
Kas ir daļēji pievienoties?
Daļēja pievienošanās ir metode, ko izmanto efektīvai vaicājumu apstrādei izplatītās datu bāzes vidēs. Apsveriet situāciju, kad darbinieku datu bāze (kurā ir informācija, piemēram, darbinieka vārds, nodaļas numurs, kurā viņa strādā utt.), kas atrodas 1. vietā, un nodaļas datu bāze (kurā ir informācija, piemēram, nodaļas numurs, nodaļas nosaukums, atrašanās vieta utt.), kas atrodas objektā. 2. Piemēram, ja mēs vēlamies iegūt darbinieka vārdu un nodaļas nosaukumu, kurā viņa strādā (tikai nodaļām, kas atrodas “Ņujorkā”), izpildot vaicājumu vaicājumu procesorā, kas atrodas 3. vietnē, ir vairāki veidi, kā datus var pārsūtīt starp trim vietām, lai veiktu šo uzdevumu. Bet, pārsūtot datus, ir svarīgi atzīmēt, ka nav nepieciešams pārsūtīt visu datu bāzi starp vietnēm. Lai efektīvi izpildītu vaicājumu, tikai daži atribūti (vai korteži), kas nepieciešami savienošanai, ir jāpārsūta starp vietnēm. Daļēja pievienošanās ir metode, ko var izmantot, lai samazinātu datu apjomu, kas tiek nosūtīts starp vietnēm. Daļēji savienojot, tikai savienojuma kolonna tiek pārsūtīta no vienas vietnes uz otru, un pēc tam šī pārnestā kolonna tiek izmantota, lai samazinātu nosūtīto attiecību lielumu starp citām vietnēm. Iepriekš minētajā piemērā varat vienkārši pārsūtīt nodaļas numuru un nodaļas nosaukumu kortežām ar location=”Ņujorka” no 2. vietas uz 1. vietu un veikt savienošanu 1. vietā un pārsūtīt galīgo attiecību atpakaļ uz vietni 3.
Kas ir Blūma pievienošanās?
Kā minēts iepriekš, Bloom Join ir vēl viena metode, ko izmanto, lai izvairītos no nevajadzīgu datu pārsūtīšanas starp vietnēm, izpildot vaicājumus izplatītās datu bāzes vidēs. Ziedēšanas laikā, nevis pārsūtot pašu savienojuma kolonnu, starp vietām tiek pārsūtīts kompakts savienojuma kolonnas attēlojums. Bloom pievienošanās izmanto Bloom filtru, kas izmanto bitu vektoru, lai izpildītu dalības vaicājumus. Pirmkārt, izmantojot savienojuma kolonnu, tiek izveidots ziedēšanas filtrs un tas tiek pārnests starp vietām un pēc tam tiek veiktas savienošanas darbības.
Kāda ir atšķirība starp Semi Join un Bloom Join?
Lai gan tiek izmantotas gan daļēji savienošanas, gan bloom savienošanas metodes, lai samazinātu datu apjomu, kas tiek pārsūtīts starp vietnēm, izpildot vaicājumus sadalītā datu bāzes vidē, bloom savienošana samazina pārsūtīto datu apjomu (korežu skaitu), salīdzinot ar daļēji pievienojieties, izmantojot ziedēšanas filtru koncepciju, kas izmanto bitu vektoru, lai noteiktu kopas dalību. Tāpēc Bloom savienojuma izmantošana būs efektīvāka nekā daļēji savienošana.