Javascript-форум (https://javascript.ru/forum/)
-   Элементы интерфейса (https://javascript.ru/forum/dom-window/)
-   -   Как оптимизировать функцию фильтрации? (https://javascript.ru/forum/dom-window/84311-kak-optimizirovat-funkciyu-filtracii.html)

dc65k 03.08.2022 14:14

Как оптимизировать функцию фильтрации?
 
Всем привет, подскажите, как более оптимально отфильтровать данные:

const data = [
    {
        "date": "2020-03-02",
        "value": "-0.00807736"
    },
    {
        "date": "2020-03-03",
        "value": "0.01775831"
    },
    {
        "date": "2020-03-04",
        "value": "0.00433390"
    },
    {
        "date": "2020-03-31",
        "value": "0.02667099"
    },
    {
        "date": "2020-04-01",
        "value": "-0.01370213"
    },
    {
        "date": "2020-04-02",
        "value": "0.02922457"
    },
    {
        "date": "2020-04-03",
        "value": "0.01015846"
    },
    {
        "date": "2020-04-06",
        "value": "0.01984755"
    },
    {
        "date": "2020-04-07",
        "value": "0.00296561"
    },
    {
        "date": "2020-04-08",
        "value": "0.01393626"
    },
    {
        "date": "2020-04-09",
        "value": "0.01132951"
    },
    {
        "date": "2020-04-10",
        "value": "-0.00822985"
    },
    {
        "date": "2020-04-13",
        "value": "-0.01640604"
    },
    {
        "date": "2020-05-04",
        "value": "-0.00000651"
    },
    {
        "date": "2020-05-05",
        "value": "-0.00000513"
    },
    {
        "date": "2020-05-06",
        "value": "-0.00501929"
    },
    {
        "date": "2020-05-07",
        "value": "0.00339571"
    },
    {
        "date": "2020-05-08",
        "value": "0.00176003"
    }
]

/*
    output
    [
        2020-03-02,
        2020-04-01,
        2020-05-04,
    ]
 */

const filtered = (data) => Object.values(data.reduceRight((accumulator, currentValue) => {

    accumulator[new Date(currentValue.date).getMonth()] = currentValue.date

    return accumulator
}, {}))

console.log(filtered(data));

ksa 03.08.2022 14:34

Цитата:

Сообщение от dc65k
как более оптимально отфильтровать данные

Это не фильтр. :nono:

Ты хочешь узнать про первые "обращения" в каждом месяце?

voraa 03.08.2022 14:57

У тебя filtered возвращает объект, а в примере вывода ты рисуешь массив.
Чего надо то?
И по какому критерию оптимизировать?
По длине кода? По скорости выполнения?

dc65k 03.08.2022 15:54

"Ты хочешь узнать про первые обращения в каждом месяце?"

Да, верно.

dc65k 03.08.2022 15:54

Функция filtered возвращает массив.

dc65k 03.08.2022 15:55

Речь об оптимизации алгоритма.

Aetae 03.08.2022 16:12

Если даты уже отсортированы и формат закреплён, и если уж совсем оптимизировать, то наверное как-то так:
const filter = (data) => {
  if (!data || !data.length) return [];

  const firstDate = data[0].date;
  const result = [ firstDate ];

  let lastMonth = firstDate.slice(5, 7);

  for (let i = 1; i < data.length; i++) {
    const { date } = data[i];
    const month = date.slice(5, 7);

    if (month > lastMonth) {
      lastMonth = month;

      result.push(date);
    }
  }

  return result;
}

ksa 03.08.2022 16:47

Предложу такой вариант...
const data = [
    {
        "date": "2020-03-02",
        "value": "-0.00807736"
    },
    {
        "date": "2020-03-03",
        "value": "0.01775831"
    },
    {
        "date": "2020-03-04",
        "value": "0.00433390"
    },
    {
        "date": "2020-03-31",
        "value": "0.02667099"
    },
    {
        "date": "2020-04-01",
        "value": "-0.01370213"
    },
    {
        "date": "2020-04-02",
        "value": "0.02922457"
    },
    {
        "date": "2020-04-03",
        "value": "0.01015846"
    },
    {
        "date": "2020-04-06",
        "value": "0.01984755"
    },
    {
        "date": "2020-04-07",
        "value": "0.00296561"
    },
    {
        "date": "2020-04-08",
        "value": "0.01393626"
    },
    {
        "date": "2020-04-09",
        "value": "0.01132951"
    },
    {
        "date": "2020-04-10",
        "value": "-0.00822985"
    },
    {
        "date": "2020-04-13",
        "value": "-0.01640604"
    },
    {
        "date": "2020-05-04",
        "value": "-0.00000651"
    },
    {
        "date": "2020-05-05",
        "value": "-0.00000513"
    },
    {
        "date": "2020-05-06",
        "value": "-0.00501929"
    },
    {
        "date": "2020-05-07",
        "value": "0.00339571"
    },
    {
        "date": "2020-05-08",
        "value": "0.00176003"
    }
]

/*
    output
    [
        2020-03-02,
        2020-04-01,
        2020-05-04,
    ]
 */

const filtered = data => {
	const o = {}
	for (let i = 0; i < data.length; i++) {
		const m = data[i].date.slice(0, 7)
		if (o[m]) continue
		o[m] = data[i].date
	}
	return Object.values(o)
}

alert(filtered(data));

Alexandroppolus 03.08.2022 18:16

Цитата:

Сообщение от Aetae
Если даты уже отсортированы

тогда можно ещё прикинуть, сколько примерно записей бывает за месяц, и в цикле прибавлять не i++, а i += k. Если набижали на новый месяц, то ищем начало нового месяца, идя от прошлой записи и прибавляя 1 (или идя назад).
Если в среднем M сообщений за месяц, то взяв k = sqrt(M), получим O(N / sqrt(M)) вместо (O(N))

при маленьких М, конечно, толку от этого не будет.. Хотя надо заметить, что при малых M и записей всего очень мало (потому как за 100 лет было всего 1200 месяцев, и оптимизировать нечего). Т.е. М, судя по всему, здоровенное.

voraa 03.08.2022 19:31

Цитата:

Сообщение от Alexandroppolus
Если в среднем M сообщений за месяц, то взяв k = sqrt(M)

В среднем M, но в каком то одном особенном 1 обращение. Как тогда k прибавлять?

Alexandroppolus 03.08.2022 19:55

Цитата:

Сообщение от voraa (Сообщение 547119)
В среднем M, но в каком то одном особенном 1 обращение. Как тогда k прибавлять?

Это как раз тот кейс, когда выскочили на один из следующих месяцев.

Тогда мы просто обходим перепрыгнутый отрезок пошагово, и подбираем все первые числа месяцев, которые на нем оказались.

Alexandroppolus 03.08.2022 20:42

пусть на месяц приходится (в среднем) М записей.

тогда если обходить подневно, то на один месяц будет М проверок.

если применить мою оптимизацию однократно, то будет M^(1/2) больших прыжков длиной M^(1/2), и один неудачный отрезок тоже длиной M^(1/2), который идем по дням.
итого 2 * M^(1/2) проверок.

но можно пойти дальше и сделать 3 "слоя": на первом прыгать через M^(2/3), на втором - через M^(1/3) внутри неудачного отрезка.
итого выходит уже 3 * M^(1/3) проверок, то есть при М = 1000000 всего 300 проверок на месяц. Недурственно.

Alexandroppolus 03.08.2022 21:17

Ну и конечно, если месяцев совсем мало, можно просто найти их границы двоичным поиском.


Часовой пояс GMT +3, время: 17:27.