From c023b6c8d5220ffa46a2613686f9693920a29872 Mon Sep 17 00:00:00 2001 From: Vsevolod Tsilyurik Date: Tue, 10 Oct 2017 17:40:38 +0500 Subject: [PATCH 1/3] beta --- index.html | 180 +++++++++++++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 180 insertions(+) diff --git a/index.html b/index.html index 3847656..d0121b6 100644 --- a/index.html +++ b/index.html @@ -5,5 +5,185 @@ Задача «TXT2HTML» + +
Блог компании Яндекс.
+ +

ЯНДЕКС.ПОЧТА: КАК МЫ ИЗМЕРЯЕМ СКОРОСТЬ ЗАГРУЗКИ И УЛУЧШАЕМ ЕЁ

+

Если ваш сайт медленно грузится, вы рискуете тем, что люди не оценят ни то, + какой он красивый, ни то, какой он удобный. Никому не понравится, когда все тормозит. Мы регулярно добавляем в Яндекс.Почту новую функциональность, иногда — исправляем ошибки, а это значит, у нас постоянно появляются новый код и новая логика. Всё это напрямую влияет на скорость работы интерфейса.

+

Что мы измеряем

+
+

Этапы первой загрузки:

+ +
+
+

Этапы отрисовки любой страницы:

+ +
+ + //quotes? + — «Ок, теперь у нас есть метрики, мы можем отправить их на сервер» - говорим мы + — «Что же дальше?» - вопрошаете вы + — «А давай построим график!» - отвечаем мы + — «А что будем считать?» - уточняете вы + +

Как вы знаете, медиана – это серединное, а не среднее значение в выборке. Если у нас имеются числа 1, 2, 2, 3, 8, 10, 20, то медиана – 3, а среднее – 6,5. В общем случае медиана отлично показывает, сколько грузится средний пользователь.

+

В случае ускорения или замедления медиана, конечно, изменится. Но она не может рассказать, сколько пользователей ускорилось, а сколько замедлилось.

+

APDEX – метрика, которая сразу говорит: хорошо или плохо. Метрика работает очень просто. Мы выбираем временной интервал [0; t], такой, что если время показа страницы попало в него, то пользователь счастлив. Берем еще один интервал, (t; 4t] (в четыре раза больше первого), и считаем, что если страница показана за это время, то пользователь в целом удовлетворен скоростью работы, но уже не настолько счастлив. И применяем формулу:

+ + // symfin for formules + (кол-во счастливых пользователей + кол-во удовлетворенных / 2) / (кол-во всех). + Получается значение от нуля до единицы, которое, видимо, лучше всего показывает, + хорошо или плохо работает почта. + +

Как мы измеряем

+

Сейчас модуль обновления сам логирует все свои стадии, и можно легко понять причину замедления: медленнее стал отвечать сервер либо слишком долго выполняется JavaScript. Выглядит это примерно так:

+ + this.timings['look-ma-im-start'] = Date.now(); + this.timings['look-ma-finish'] = Date.now(); + +

C помощью Date.now() мы получаем текущее время. Все тайминги собираются и при + отправке рассчитываются. На этапах разница между “end” и “start” не считается, + а все вычисления производятся в конце:

+ var totalTime = this.timings['look-ma-finish'] - this.timings['look-ma-im-start']; +

И на сервер прилетают подобные записи:

+ serverResponse=50&domUpdate=60 +

Как мы ускоряем

+

Чтобы снизить время загрузки почты при выходе новых версий, мы уже делаем следующее:

+ +

Мы подумали: «А что если хранить где-то старую версию файлов, а при выходе новой передавать только diff между ней и той, которая сохранена у пользователя?» В браузере же останется просто наложить патч на клиенте.

+

На самое деле эта идея не нова. Уже существуют стандарты для HTTP — например, RFC 3229 «Delta encoding in HTTP» и «Google SDHC», — но по разным причинам они не получили должного распространения в браузерах и на серверах.

+

Мы же решили сделать свой аналог на JS. Чтобы реализовать этот метод обновления, начали искать реализации diff на JS. На популярных хостингах кода нашли библиотеки:

+ +

Для окончательного выбора библиотеки нам нужно сравнить:

+ + + + + + + + + + + + + + + + +
БиблиотекаIE 9Opera 12
vcdiff85
google diff136376
+

После того как мы определились с библиотекой для диффа, нужно определиться с тем, где и как хранить статику на клиенте.

+

Формат файла с патчами для проекта выглядит так:

+ + [ + { + "k": "jane.css", + "p": [patch], + "s": 4554 + }, + { + "k": "jane.css", + "p": [patch], + "s": 4554 + } + ] + +

То есть это обычный массив из объектов. Каждый объект — отдельный ресурс. У каждого объекта есть три свойства. k — названия ключа в localStorage для этого ресурса. p — патч для ресурса, который сгенерировал vcdiff. s — чексумма для ресурса актуальной версии, чтобы потом можно было проверить правильность наложения патча на клиенте. Чексумма вычисляется по алгоритму Флетчера.

+

Алгоритм Бройдена — Флетчера — Гольдфарба — Шанно (BFGS) — итерационный метод численной оптимизации, предназначенный для нахождения локального максимума/минимума нелинейного функционала без ограничений.

+

Почему именно алгоритм Флетчера, а не другие популярные алгоритмы вроде:

+ +

Потому что он быстрый, компактный и легок в реализации.

+

Итог

+Фактически мы экономим 80-90% трафика. Размер загружаемой статитки в байтах: + + + + + + + + + + + + + + + + + + + + + +
РелизС патчемБез патча
7.7.20397174 549
7.7.2138353 995
7.7.224833 995
+ +Автор: @doochik +С++ разработик +Электронная почта: (doochik@yandex-team.ru) +Компания: Яндекс + +Комментарии (3): + +- Mogaika (mogaika@yandex-team.ru) 30 ноября 2014 в 17:05 + + А можете привести сравнение, на сколько быстрее грузится lite версия? + +- JIguse (mrawesome@yandex.ru) 29 ноября 2014 в 21:30 + + Спасибо за статью, познавательно. Здорово, что Яндекс делится некоторыми + подробностями о внутренней работе сервисов. + +- Brister (brist89@yandex-team.ru) 24 ноября 2014 в 13:13 + + (кол-во счастливых пользователей + кол-во удовлетворенных / 2) / (кол-во всех). + Получается значение от нуля до единицы, которое, видимо, лучше всего показывает, + хорошо или плохо работает почта. + + наверное все-таки от 0.5 до 1 + +- alexeimois (test@yandex.ru) 22 ноября 2014 в 17:35 + + Мы измеряем скорость загрузки с помощью Яндекс.Метрики: + help.yandex.ru/metrika/reports/monitoring_timing.xml + + From 06e329e3e0e2a1d231be28291a86cdb42ddf2eb9 Mon Sep 17 00:00:00 2001 From: Vsevolod Tsilyurik Date: Tue, 10 Oct 2017 18:21:11 +0500 Subject: [PATCH 2/3] beta --- index.html | 350 +++++++++++++++++++++++++---------------------------- 1 file changed, 163 insertions(+), 187 deletions(-) diff --git a/index.html b/index.html index d0121b6..a85db8f 100644 --- a/index.html +++ b/index.html @@ -1,189 +1,165 @@ - - - Задача «TXT2HTML» - - - -
Блог компании Яндекс.
- -

ЯНДЕКС.ПОЧТА: КАК МЫ ИЗМЕРЯЕМ СКОРОСТЬ ЗАГРУЗКИ И УЛУЧШАЕМ ЕЁ

-

Если ваш сайт медленно грузится, вы рискуете тем, что люди не оценят ни то, - какой он красивый, ни то, какой он удобный. Никому не понравится, когда все тормозит. Мы регулярно добавляем в Яндекс.Почту новую функциональность, иногда — исправляем ошибки, а это значит, у нас постоянно появляются новый код и новая логика. Всё это напрямую влияет на скорость работы интерфейса.

-

Что мы измеряем

-
-

Этапы первой загрузки:

-
    -
  • подготовка;
  • -
  • загрузка статики (HTTP-запрос и парсинг);
  • -
  • исполнение модулей;
  • -
  • инициализация базовых объектов;
  • -
  • отрисовка.
  • -
-
-
-

Этапы отрисовки любой страницы:

-
    -
  • подготовка к запросу на сервер;
  • -
  • запрос данных с сервера;
  • -
  • шаблонизация;
  • -
  • обновление DOM.
  • -
-
- - //quotes? - — «Ок, теперь у нас есть метрики, мы можем отправить их на сервер» - говорим мы - — «Что же дальше?» - вопрошаете вы - — «А давай построим график!» - отвечаем мы - — «А что будем считать?» - уточняете вы - -

Как вы знаете, медиана – это серединное, а не среднее значение в выборке. Если у нас имеются числа 1, 2, 2, 3, 8, 10, 20, то медиана – 3, а среднее – 6,5. В общем случае медиана отлично показывает, сколько грузится средний пользователь.

-

В случае ускорения или замедления медиана, конечно, изменится. Но она не может рассказать, сколько пользователей ускорилось, а сколько замедлилось.

-

APDEX – метрика, которая сразу говорит: хорошо или плохо. Метрика работает очень просто. Мы выбираем временной интервал [0; t], такой, что если время показа страницы попало в него, то пользователь счастлив. Берем еще один интервал, (t; 4t] (в четыре раза больше первого), и считаем, что если страница показана за это время, то пользователь в целом удовлетворен скоростью работы, но уже не настолько счастлив. И применяем формулу:

- - // symfin for formules - (кол-во счастливых пользователей + кол-во удовлетворенных / 2) / (кол-во всех). - Получается значение от нуля до единицы, которое, видимо, лучше всего показывает, - хорошо или плохо работает почта. - -

Как мы измеряем

-

Сейчас модуль обновления сам логирует все свои стадии, и можно легко понять причину замедления: медленнее стал отвечать сервер либо слишком долго выполняется JavaScript. Выглядит это примерно так:

- - this.timings['look-ma-im-start'] = Date.now(); - this.timings['look-ma-finish'] = Date.now(); - -

C помощью Date.now() мы получаем текущее время. Все тайминги собираются и при - отправке рассчитываются. На этапах разница между “end” и “start” не считается, - а все вычисления производятся в конце:

- var totalTime = this.timings['look-ma-finish'] - this.timings['look-ma-im-start']; -

И на сервер прилетают подобные записи:

- serverResponse=50&domUpdate=60 -

Как мы ускоряем

-

Чтобы снизить время загрузки почты при выходе новых версий, мы уже делаем следующее:

- -

Мы подумали: «А что если хранить где-то старую версию файлов, а при выходе новой передавать только diff между ней и той, которая сохранена у пользователя?» В браузере же останется просто наложить патч на клиенте.

-

На самое деле эта идея не нова. Уже существуют стандарты для HTTP — например, RFC 3229 «Delta encoding in HTTP» и «Google SDHC», — но по разным причинам они не получили должного распространения в браузерах и на серверах.

-

Мы же решили сделать свой аналог на JS. Чтобы реализовать этот метод обновления, начали искать реализации diff на JS. На популярных хостингах кода нашли библиотеки:

- -

Для окончательного выбора библиотеки нам нужно сравнить:

- - - - - - - - - - - - - - - - -
БиблиотекаIE 9Opera 12
vcdiff85
google diff136376
-

После того как мы определились с библиотекой для диффа, нужно определиться с тем, где и как хранить статику на клиенте.

-

Формат файла с патчами для проекта выглядит так:

- - [ - { - "k": "jane.css", - "p": [patch], - "s": 4554 - }, - { - "k": "jane.css", - "p": [patch], - "s": 4554 - } - ] - -

То есть это обычный массив из объектов. Каждый объект — отдельный ресурс. У каждого объекта есть три свойства. k — названия ключа в localStorage для этого ресурса. p — патч для ресурса, который сгенерировал vcdiff. s — чексумма для ресурса актуальной версии, чтобы потом можно было проверить правильность наложения патча на клиенте. Чексумма вычисляется по алгоритму Флетчера.

-

Алгоритм Бройдена — Флетчера — Гольдфарба — Шанно (BFGS) — итерационный метод численной оптимизации, предназначенный для нахождения локального максимума/минимума нелинейного функционала без ограничений.

-

Почему именно алгоритм Флетчера, а не другие популярные алгоритмы вроде:

- -

Потому что он быстрый, компактный и легок в реализации.

-

Итог

-Фактически мы экономим 80-90% трафика. Размер загружаемой статитки в байтах: - - - - - - - - - - - - - - - - - - - - - -
РелизС патчемБез патча
7.7.20397174 549
7.7.2138353 995
7.7.224833 995
- -Автор: @doochik -С++ разработик -Электронная почта: (doochik@yandex-team.ru) -Компания: Яндекс - -Комментарии (3): - -- Mogaika (mogaika@yandex-team.ru) 30 ноября 2014 в 17:05 - - А можете привести сравнение, на сколько быстрее грузится lite версия? - -- JIguse (mrawesome@yandex.ru) 29 ноября 2014 в 21:30 - - Спасибо за статью, познавательно. Здорово, что Яндекс делится некоторыми - подробностями о внутренней работе сервисов. - -- Brister (brist89@yandex-team.ru) 24 ноября 2014 в 13:13 - - (кол-во счастливых пользователей + кол-во удовлетворенных / 2) / (кол-во всех). - Получается значение от нуля до единицы, которое, видимо, лучше всего показывает, - хорошо или плохо работает почта. - - наверное все-таки от 0.5 до 1 - -- alexeimois (test@yandex.ru) 22 ноября 2014 в 17:35 - - Мы измеряем скорость загрузки с помощью Яндекс.Метрики: - help.yandex.ru/metrika/reports/monitoring_timing.xml -
© Яндекс, help@yandex.ru, Хохрякова, 10
- - - + + + Задача «TXT2HTML» + + +
Блог компании Яндекс.
+
+

ЯНДЕКС.ПОЧТА: КАК МЫ ИЗМЕРЯЕМ СКОРОСТЬ ЗАГРУЗКИ И УЛУЧШАЕМ ЕЁ

+

Если ваш сайт медленно грузится, вы рискуете тем, что люди не оценят ни то, какой он красивый, ни то, какой он удобный. Никому не понравится, когда все тормозит. Мы регулярно добавляем в Яндекс.Почту новую функциональность, иногда — исправляем ошибки, а это значит, у нас постоянно появляются новый код и новая логика. Всё это напрямую влияет на скорость работы интерфейса.

+
+

Что мы измеряем

+
+

Этапы первой загрузки:

+
    +
  • подготовка;
  • +
  • загрузка статики (HTTP-запрос и парсинг);
  • +
  • исполнение модулей;
  • +
  • инициализация базовых объектов;
  • +
  • отрисовка.
  • +
+
+
+

Этапы отрисовки любой страницы:

+
    +
  • подготовка к запросу на сервер;
  • +
  • запрос данных с сервера;
  • +
  • шаблонизация;
  • +
  • обновление DOM.
  • +
+
+
+

— «Ок, теперь у нас есть метрики, мы можем отправить их на сервер» - говорим мы

+

— «Что же дальше?» - вопрошаете вы

+

— «А давай построим график!» - отвечаем мы

+

— «А что будем считать?» - уточняете вы

+
+

Как вы знаете, медиана – это серединное, а не среднее значение в выборке. Если у нас имеются числа 1, 2, 2, 3, 8, 10, 20, то медиана – 3, а среднее – 6,5. В общем случае медиана отлично показывает, сколько грузится средний пользователь.

+

В случае ускорения или замедления медиана, конечно, изменится. Но она не может рассказать, сколько пользователей ускорилось, а сколько замедлилось.

+

APDEX – метрика, которая сразу говорит: хорошо или плохо. Метрика работает очень просто. Мы выбираем временной интервал [0; t], такой, что если время показа страницы попало в него, то пользователь счастлив. Берем еще один интервал, (t; 4t] (в четыре раза больше первого), и считаем, что если страница показана за это время, то пользователь в целом удовлетворен скоростью работы, но уже не настолько счастлив. И применяем формулу:

+

(кол-во счастливых пользователей + кол-во удовлетворенных / 2) / (кол-во всех).

+

Получается значение от нуля до единицы, которое, видимо, лучше всего показывает, хорошо или плохо работает почта.

+

Как мы измеряем

+

Сейчас модуль обновления сам логирует все свои стадии, и можно легко понять причину замедления: медленнее стал отвечать сервер либо слишком долго выполняется JavaScript. Выглядит это примерно так:

+ + this.timings['look-ma-im-start'] = Date.now(); + this.timings['look-ma-finish'] = Date.now(); + +

C помощью Date.now() мы получаем текущее время. Все тайминги собираются и при + отправке рассчитываются. На этапах разница между “end” и “start” не считается, + а все вычисления производятся в конце:

+ var totalTime = this.timings['look-ma-finish'] - this.timings['look-ma-im-start']; +

И на сервер прилетают подобные записи:

+ serverResponse=50&domUpdate=60 +
+
+

Как мы ускоряем

+

Чтобы снизить время загрузки почты при выходе новых версий, мы уже делаем следующее:

+
    +
  • включаем gzip;
  • +
  • выставляем заголовки кэширования;
  • +
  • фризим CSS, JS, шаблоны и картинки;
  • +
  • используем CDN;
  • +
+

Мы подумали: «А что если хранить где-то старую версию файлов, а при выходе новой передавать только diff между ней и той, которая сохранена у пользователя?» В браузере же останется просто наложить патч на клиенте.

+

На самое деле эта идея не нова. Уже существуют стандарты для HTTP — например, RFC 3229 «Delta encoding in HTTP» и «Google SDHC», — но по разным причинам они не получили должного распространения в браузерах и на серверах.

+

Мы же решили сделать свой аналог на JS. Чтобы реализовать этот метод обновления, начали искать реализации diff на JS. На популярных хостингах кода нашли библиотеки:

+
    +
  • - VCDiff
  • +
  • - google-diff-patch-match
  • +
+

Для окончательного выбора библиотеки нам нужно сравнить:

+ + + + + + + + + + + + + + + + +
БиблиотекаIE 9Opera 12
vcdiff85
google diff136376
+

После того как мы определились с библиотекой для диффа, нужно определиться с тем, где и как хранить статику на клиенте.

+

Формат файла с патчами для проекта выглядит так:

+ +[ + { + "k": "jane.css", + "p": [patch], + "s": 4554 + }, + { + "k": "jane.css", + "p": [patch], + "s": 4554 + } +] + +

То есть это обычный массив из объектов. Каждый объект — отдельный ресурс. У каждого объекта есть три свойства. k — названия ключа в localStorage для этого ресурса. p — патч для ресурса, который сгенерировал vcdiff. s — чексумма для ресурса актуальной версии, чтобы потом можно было проверить правильность наложения патча на клиенте. Чексумма вычисляется по алгоритму Флетчера.

+ +

Алгоритм Бройдена — Флетчера — Гольдфарба — Шанно (BFGS) — итерационный метод численной оптимизации, предназначенный для нахождения локального максимума/минимума нелинейного функционала без ограничений.

+

Почему именно алгоритм Флетчера, а не другие популярные алгоритмы вроде:

+
    +
  • CRC16/32 - алгоритм нахождения контрольной суммы, предназначенный для проверки целостности данных
  • +
  • md5 - 128-битный алгоритм хеширования. Предназначен для создания «отпечатков» или дайджестов сообщения произвольной длины и последующей проверки их подлинности.
  • +
+

Потому что он быстрый, компактный и легок в реализации.

+
+
+

Итог

+

Фактически мы экономим 80-90% трафика. Размер загружаемой статитки в байтах:

+ + + + + + + + + + + + + + + + + + + + + +
РелизС патчемБез патча
7.7.20397174 549
7.7.2138353 995
7.7.224833 995
+
+ +
+
+

Комментарии (3):

+

- Mogaika (mogaika@yandex-team.ru) 30 ноября 2014 в 17:05

+

А можете привести сравнение, на сколько быстрее грузится lite версия?

+

- JIguse (mrawesome@yandex.ru 29 ноября 2014 в 21:30

+

Спасибо за статью, познавательно. Здорово, что Яндекс делится некоторыми подробностями о внутренней работе сервисов.

+

- Brister (brist89@yandex-team.ru) 24 ноября 2014 в 13:13

+

(кол-во счастливых пользователей + кол-во удовлетворенных / 2) / (кол-во всех). Получается значение от нуля до единицы, которое, видимо, лучше всего показывает, хорошо или плохо работает почта.

+

наверное все-таки от 0.5 до 1

+

- alexeimois (test@yandex.ru) 22 ноября 2014 в 17:35

+

Мы измеряем скорость загрузки с помощью Яндекс.Метрики:

+

help.yandex.ru/metrika/reports/monitoring_timing.xml

+
+ + + \ No newline at end of file From 04057d00977ce7350349a5459e0467a005cce9c6 Mon Sep 17 00:00:00 2001 From: Vsevolod Tsilyurik Date: Tue, 10 Oct 2017 18:26:28 +0500 Subject: [PATCH 3/3] beta --- index.html | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) diff --git a/index.html b/index.html index a85db8f..cd89112 100644 --- a/index.html +++ b/index.html @@ -105,7 +105,7 @@

Формат файла с патчами для проекта выгляд ]

То есть это обычный массив из объектов. Каждый объект — отдельный ресурс. У каждого объекта есть три свойства. k — названия ключа в localStorage для этого ресурса. p — патч для ресурса, который сгенерировал vcdiff. s — чексумма для ресурса актуальной версии, чтобы потом можно было проверить правильность наложения патча на клиенте. Чексумма вычисляется по алгоритму Флетчера.

- + Алгоритм Флетчера

Алгоритм Бройдена — Флетчера — Гольдфарба — Шанно (BFGS) — итерационный метод численной оптимизации, предназначенный для нахождения локального максимума/минимума нелинейного функционала без ограничений.

Почему именно алгоритм Флетчера, а не другие популярные алгоритмы вроде:

    @@ -148,7 +148,7 @@

    Итог

    -

    Комментарии (3):

    +

    Комментарии (3):

    - Mogaika (mogaika@yandex-team.ru) 30 ноября 2014 в 17:05

    А можете привести сравнение, на сколько быстрее грузится lite версия?

    - JIguse (mrawesome@yandex.ru 29 ноября 2014 в 21:30