Improve performance of database page #1401

harrislapiroff · 2022-04-07T13:19:14Z

We're getting >5s responses on the database page. As with #1400, Cloudflare takes care of some of this, but editors still get a fresh response, as does anyone who uses an unusual combination of filters and, again, we're worried it might be blocking other requests.

https://pressfreedomtracker.us/all-incidents/

urlsangel · 2022-04-14T11:20:16Z

@harrislapiroff

I've started off by profiling the get_context method of the database page, going line by line to see where the bottlenecks are.

I've not implemented any improvements yet, but you can certainly see some big jumps in CPU usage.

Note: these times are with Django Debug Toolbar active, so the response times are massive, but they are all relative, so I think they will give us useful info.

    def get_context(self, request, *args, **kwargs):
        from common.models import CategoryPage
        context = super(IncidentIndexPage, self).get_context(request, *args, **kwargs)
        # CPU: 13622.299 msec
        # SQL: default 90.77 ms (47 queries including 26 similar and 22 duplicates )

        context['all_incident_count'] = len(IncidentFilter({}).get_queryset())
        # CPU: 13498.862 msec
        # SQL: default 83.86 ms (47 queries including 26 similar and 22 duplicates )

        incident_filter = IncidentFilter(request.GET)
        # CPU: 13860.154 msec
        # SQL: default 81.34 ms (47 queries including 26 similar and 22 duplicates )

        context['serialized_filters'] = json.dumps(get_serialized_filters())
        # CPU: 14995.236 msec
        # SQL: default 88.75 ms (50 queries including 32 similar and 28 duplicates )

        search_settings = SearchSettings.for_site(Site.find_for_request(request))
        # CPU: 15628.019 msec
        # SQL: default 78.66 ms (51 queries including 32 similar and 28 duplicates )

        if search_settings.data_download_page:
            context['export_path'] = search_settings.data_download_page.get_url()
        # CPU: 14214.802 msec
        # SQL: default 73.66 ms (51 queries including 32 similar and 28 duplicates )

        else:
            context['export_path'] = self.url + self.reverse_subpage('export_view')
        # CPU: 14963.686 msec
        # SQL: default 88.13 ms (51 queries including 32 similar and 28 duplicates )

        if search_settings.learn_more_page:
            context['learn_more_path'] = search_settings.learn_more_page.get_url()
        # CPU: 15061.529 msec
        # SQL: default 62.01 ms (51 queries including 32 similar and 28 duplicates )

        incident_filter.clean()
        # CPU: 15531.886 msec
        # SQL: default 98.72 ms (54 queries including 35 similar and 31 duplicates )

        context['search_value'] = incident_filter.cleaned_data.get('search', '')
        # CPU: 15926.458 msec
        # SQL: default 97.99 ms (54 queries including 35 similar and 31 duplicates )

        category_data = incident_filter.cleaned_data.get('categories')
        # CPU: 15855.405 msec
        # SQL: default 74.49 ms (54 queries including 35 similar and 31 duplicates )

        if not category_data:
            context['categories'] = CategoryPage.objects.live()
        # CPU: 15921.364 msec
        # SQL: default 82.44 ms (54 queries including 35 similar and 31 duplicates )

        else:
            context['categories'] = CategoryPage.objects.live().filter(
                models.Q(pk__in=category_data.pks) | models.Q(title__in=category_data.strings)
            )
        # CPU: 15091.855 msec
        # SQL: default 88.57 ms (54 queries including 35 similar and 31 duplicates )

        if incident_filter.cleaned_data:
            context['filtered_export_path'] = (
                context['export_path'] +
                '?' +
                parse.urlencode(incident_filter.cleaned_data)
            )
        # CPU: 15915.301 msec
        # SQL: default 82.65 ms (54 queries including 35 similar and 31 duplicates )

        incident_qs = incident_filter.get_queryset() \
            .with_public_associations() \
            .with_most_recent_update() \

        # CPU: 14680.233 msec
        # SQL: default 84.42 ms (54 queries including 35 similar and 31 duplicates )

        # CPU: 16034.366 msec
        # SQL: default 81.46 ms (54 queries including 35 similar and 31 duplicates )

        # CPU: 15800.615 msec
        # SQL: default 76.79 ms (54 queries including 35 similar and 31 duplicates )

        paginator, entries = paginate(
            request,
            incident_qs,
            page_key=DEFAULT_PAGE_KEY,
            per_page=8,
            orphans=5
        )
        # CPU: 16264.933 msec
        # SQL: default 83.90 ms (55 queries including 35 similar and 31 duplicates )

        context['entries_page'] = entries
        # CPU: 26137.260 msec
        # SQL: default 117.51 ms (91 queries including 51 similar and 39 duplicates )

        context['paginator'] = paginator
        # CPU: 25801.798 msec
        # SQL: default 122.81 ms (91 queries including 51 similar and 39 duplicates )

        context['summary_table'] = incident_filter.get_summary()
        # CPU: 32551.078 msec
        # SQL: default 141.57 ms (96 queries including 51 similar and 39 duplicates )

        get_data = request.GET.copy()
        # CPU: 32932.981 msec
        # SQL: default 144.91 ms (96 queries including 51 similar and 39 duplicates )

        context['sort_choices'] = []
        for value, label in IncidentFilter.SortOptions.choices:
            get_data['sort'] = value
            context['sort_choices'].append(
                (get_data.urlencode(), label, value == incident_filter.sort.value)
            )
        # CPU: 32682.904 msec
        # SQL: default 260.53 ms (96 queries including 51 similar and 39 duplicates )

        context['selected_sort'] = incident_filter.sort
        # CPU: 32510.106 msec
        # SQL: default 148.10 ms (96 queries including 51 similar and 39 duplicates )

        context['incident_count'] = len(incident_qs)
        # CPU: 59793.335 msec
        # SQL: default 195.33 ms (113 queries including 51 similar and 41 duplicates )

        if request.is_ajax():
            context['layout_template'] = 'base.ajax.html'
        # CPU: 62599.996 msec
        # SQL: default 231.05 ms (116 queries including 53 similar and 41 duplicates )

        else:
            context['layout_template'] = 'base.html'
        # CPU: 63089.314 msec
        # SQL: default 231.05 ms (116 queries including 53 similar and 41 duplicates )

        context['filters'] = get_filter_forms(request, json.loads(context['serialized_filters']))
        # CPU: 63351.939 msec
        # SQL: default 218.40 ms (122 queries including 55 similar and 43 duplicates )

        return context

urlsangel · 2022-04-14T15:34:44Z

@harrislapiroff

Notes and a PR here: #1411

harrislapiroff · 2023-01-18T21:04:03Z

Closing this ticket. Let's open more specific tickets where possible a la #1573

harrislapiroff closed this as completed Jan 18, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Improve performance of database page #1401

Improve performance of database page #1401

harrislapiroff commented Apr 7, 2022

urlsangel commented Apr 14, 2022

urlsangel commented Apr 14, 2022

harrislapiroff commented Jan 18, 2023

Improve performance of database page #1401

Improve performance of database page #1401

Comments

harrislapiroff commented Apr 7, 2022

urlsangel commented Apr 14, 2022

urlsangel commented Apr 14, 2022

harrislapiroff commented Jan 18, 2023