Алгоритм пошуку діапазону в Java

1. Огляд

У цьому підручнику ми дослідимо концепцію пошуку сусідів у двовимірному просторі . Потім ми пройдемося по його реалізації на Java.

2. Одновимірний пошук проти двовимірного пошуку

Ми знаємо, що двійковий пошук - це ефективний алгоритм пошуку точної відповідності у списку елементів за допомогою підходу поділи і владай.

Давайте тепер розглянемо двовимірну область, де кожен елемент представлений XY координатами (точками) на площині .

Однак замість точного збігу, припустимо, ми хочемо знайти сусідів даної точки в площині. Зрозуміло, що якщо ми хочемо найближчі n збігів, то двійковий пошук не буде працювати . Це пов’язано з тим, що за допомогою двійкового пошуку можна порівняти два елементи лише за однією віссю, тоді як нам потрібно мати можливість порівняти їх за двома осями.

У наступному розділі ми розглянемо альтернативу двійковій структурі даних дерева.

3. Квадріт

Квадрево - це просторова деревоподібна структура даних, в якій кожен вузол має рівно чотири дочірні організації. Кожна дитина може бути пунктом або списком, що містить чотири підквадрети.

А точка зберігає дані - наприклад, координати XY. Область являє собою замкнуту кордон , усередині якої точка може бути збережена. Він використовується для визначення зони досяжності чотирикутника.

Давайте зрозуміємо це більше на прикладі 10 координат у довільному порядку:

(21,25), (55,53), (70,318), (98,302), (49,229), (135,229), (224,292), (206,321), (197,258), (245,238)

Перші три значення зберігатимуться як точки під кореневим вузлом, як показано на крайньому лівому малюнку.

Кореневий вузол не може вмістити нові точки зараз, оскільки він досяг своєї потужності в три точки. Отже, ми розділимо область кореневого вузла на чотири рівні квадранти .

Кожен із цих квадрантів може зберігати три точки і додатково містити чотири квадранти у своїх межах. Це може бути зроблено рекурсивно, в результаті чого буде створено дерево квадрантів, де і отримає свою назву структура даних квадрата.

На середньому малюнку вище ми можемо побачити квадранти, створені з кореневого вузла, і те, як наступні чотири точки зберігаються в цих квадрантах.

Нарешті, на самому правому малюнку показано, як один квадрант знову поділяється на більшу кількість точок у цій області, тоді як інші квадранти все ще можуть приймати нові точки.

Зараз ми побачимо, як реалізувати цей алгоритм на Java.

4. Структура даних

Давайте створимо структуру даних чотирьох дерев. Нам знадобляться три класи домену.

По-перше, ми створимо клас Point для зберігання координат XY :

public class Point { private float x; private float y; public Point(float x, float y) { this.x = x; this.y = y; } // getters & toString() }

По-друге, давайте створимо клас Region, щоб визначити межі квадранта :

public class Region { private float x1; private float y1; private float x2; private float y2; public Region(float x1, float y1, float x2, float y2) { this.x1 = x1; this.y1 = y1; this.x2 = x2; this.y2 = y2; } // getters & toString() }

Нарешті, давайте мати клас QuadTree для зберігання даних як екземпляри Point, а дочірні - як класи QuadTree :

public class QuadTree { private static final int MAX_POINTS = 3; private Region area; private List points = new ArrayList(); private List quadTrees = new ArrayList(); public QuadTree(Region area) { this.area = area; } }

Щоб створити екземпляр об’єкта QuadTree , ми вказуємо його область за допомогою класу Region через конструктор.

5. Алгоритм

Перш ніж писати основну логіку для зберігання даних, додамо кілька допоміжних методів. Вони виявляться корисними згодом.

5.1. Допоміжні методи

Давайте змінимо наш клас Region .

По-перше, давайте мати метод containsPoint, щоб вказати, чи потрапляє дана точка всередину або за межі області регіону :

public boolean containsPoint(Point point) { return point.getX() >= this.x1 && point.getX() = this.y1 && point.getY() < this.y2; }

Далі, давайте є метод doesOverlap , щоб вказати , є чи даний регіон накладень з іншого області :

public boolean doesOverlap(Region testRegion) { if (testRegion.getX2()  this.getX2()) { return false; } if (testRegion.getY1() > this.getY2()) { return false; } if (testRegion.getY2() < this.getY1()) { return false; } return true; }

Нарешті, давайте створимо метод getQuadrant, щоб розділити діапазон на чотири рівні квадранти і повернути вказаний:

public Region getQuadrant(int quadrantIndex) { float quadrantWidth = (this.x2 - this.x1) / 2; float quadrantHeight = (this.y2 - this.y1) / 2; // 0=SW, 1=NW, 2=NE, 3=SE switch (quadrantIndex) { case 0: return new Region(x1, y1, x1 + quadrantWidth, y1 + quadrantHeight); case 1: return new Region(x1, y1 + quadrantHeight, x1 + quadrantWidth, y2); case 2: return new Region(x1 + quadrantWidth, y1 + quadrantHeight, x2, y2); case 3: return new Region(x1 + quadrantWidth, y1, x2, y1 + quadrantHeight); } return null; }

5.2. Зберігання даних

Тепер ми можемо написати свою логіку для зберігання даних. Почнемо з визначення нового методу addPoint у класі QuadTree, щоб додати нову точку. Цей метод поверне true, якщо точка була успішно додана:

public boolean addPoint(Point point) { // ... }

Далі напишемо логіку для обробки суті. По-перше, нам потрібно перевірити, чи міститься точка в межах екземпляра QuadTree . Нам також потрібно переконатися, що екземпляр QuadTree не набрав максимум MAX_POINTS балів.

Якщо обидві умови задоволені, ми можемо додати новий пункт:

if (this.area.containsPoint(point)) { if (this.points.size() < MAX_POINTS) { this.points.add(point); return true; } }

On the other hand, if we've reached the MAX_POINTS value, then we need to add the new point to one of the sub-quadrants. For this, we loop through the child quadTrees list and call the same addPoint method which will return a true value on successful addition. Then we exit the loop immediately as a point needs to be added exactly to one quadrant.

We can encapsulate all this logic inside a helper method:

private boolean addPointToOneQuadrant(Point point) { boolean isPointAdded; for (int i = 0; i < 4; i++) { isPointAdded = this.quadTrees.get(i) .addPoint(point); if (isPointAdded) return true; } return false; }

Additionally, let's have a handy method createQuadrants to subdivide the current quadtree into four quadrants:

private void createQuadrants() { Region region; for (int i = 0; i < 4; i++) { region = this.area.getQuadrant(i); quadTrees.add(new QuadTree(region)); } }

We'll call this method to create quadrants only if we're no longer able to add any new points. This ensures that our data structure uses optimum memory space.

Putting it all together, we've got the updated addPoint method:

public boolean addPoint(Point point) { if (this.area.containsPoint(point)) { if (this.points.size() < MAX_POINTS) { this.points.add(point); return true; } else { if (this.quadTrees.size() == 0) { createQuadrants(); } return addPointToOneQuadrant(point); } } return false; }

5.3. Searching Data

Having our quadtree structure defined to store data, we can now think of the logic for performing a search.

As we're looking for finding adjacent items, we can specify a searchRegion as the starting point. Then, we check if it overlaps with the root region. If it does, then we add all its child points that fall inside the searchRegion.

After the root region, we get into each of the quadrants and repeat the process. This goes on until we reach the end of the tree.

Let's write the above logic as a recursive method in the QuadTree class:

public List search(Region searchRegion, List matches) { if (matches == null) { matches = new ArrayList(); } if (!this.area.doesOverlap(searchRegion)) { return matches; } else { for (Point point : points) { if (searchRegion.containsPoint(point)) { matches.add(point); } } if (this.quadTrees.size() > 0) { for (int i = 0; i < 4; i++) { quadTrees.get(i) .search(searchRegion, matches); } } } return matches; }

6. Testing

Now that we have our algorithm in place, let's test it.

6.1. Populating the Data

First, let's populate the quadtree with the same 10 coordinates we used earlier:

Region area = new Region(0, 0, 400, 400); QuadTree quadTree = new QuadTree(area); float[][] points = new float[][] { { 21, 25 }, { 55, 53 }, { 70, 318 }, { 98, 302 }, { 49, 229 }, { 135, 229 }, { 224, 292 }, { 206, 321 }, { 197, 258 }, { 245, 238 } }; for (int i = 0; i < points.length; i++) { Point point = new Point(points[i][0], points[i][1]); quadTree.addPoint(point); }

6.2. Range Search

Next, let's perform a range search in an area enclosed by lower bound coordinate (200, 200) and upper bound coordinate (250, 250):

Region searchArea = new Region(200, 200, 250, 250); List result = quadTree.search(searchArea, null);

Running the code will give us one nearby coordinate contained within the search area:

[[245.0 , 238.0]]

Let's try a different search area between coordinates (0, 0) and (100, 100):

Region searchArea = new Region(0, 0, 100, 100); List result = quadTree.search(searchArea, null);

Running the code will give us two nearby coordinates for the specified search area:

[[21.0 , 25.0], [55.0 , 53.0]]

We observe that depending on the size of the search area, we get zero, one or many points. So, if we're given a point and asked to find the nearest n neighbors, we could define a suitable search area where the given point is at the center.

Then, from all the resulting points of the search operation, we can calculate the Euclidean distances between the given points and sort them to get the nearest neighbors.

7. Time Complexity

The time complexity of a range query is simply O(n). The reason is that, in the worst-case scenario, it has to traverse through each item if the search area specified is equal to or bigger than the populated area.

8. Conclusion

У цій статті ми вперше зрозуміли поняття чотирикутника, порівнявши його з двійковим деревом. Далі ми побачили, як його можна ефективно використовувати для зберігання даних, розподілених у двовимірному просторі.

Потім ми побачили, як зберігати дані та виконувати пошук по діапазону.

Як завжди, вихідний код із тестами доступний на GitHub.