lib.itmens/common/views.py

import operator
import logging
from difflib import SequenceMatcher
from urllib.parse import urlparse
from django.shortcuts import render, redirect, reverse
from django.contrib.auth.decorators import login_required
from django.utils.translation import gettext_lazy as _
from django.core.paginator import Paginator
from django.core.validators import URLValidator
from django.core.exceptions import ValidationError, ObjectDoesNotExist
from django.db.models import Q, Count
from django.http import HttpResponseBadRequest
from books.models import Book
from movies.models import Movie
from music.models import Album, Song, AlbumMark, SongMark
from users.models import Report, User
from mastodon.decorators import mastodon_request_included
from common.models import MarkStatusEnum
from common.utils import PageLinksGenerator
from common.scraper import scraper_registry
from management.models import Announcement


# how many books have in each set at the home page
BOOKS_PER_SET = 5

# how many movies have in each set at the home page
MOVIES_PER_SET = 5

MUSIC_PER_SET = 5

# how many items are showed in one search result page
ITEMS_PER_PAGE = 20

# how many pages links in the pagination
PAGE_LINK_NUMBER = 7

# max tags on list page
TAG_NUMBER_ON_LIST = 5

logger = logging.getLogger(__name__)

@login_required
def home(request):
    if request.method == 'GET':

        # really shitty code here

        unread_announcements = Announcement.objects.filter(
            pk__gt=request.user.read_announcement_index).order_by('-pk')
        try:
            request.user.read_announcement_index = Announcement.objects.latest('pk').pk
            request.user.save(update_fields=['read_announcement_index'])
        except ObjectDoesNotExist as e:
            # when there is no annoucenment
            pass

        do_book_marks = request.user.user_bookmarks.filter(
            status=MarkStatusEnum.DO).order_by("-edited_time")
        do_books_more = True if do_book_marks.count() > BOOKS_PER_SET else False

        wish_book_marks = request.user.user_bookmarks.filter(
            status=MarkStatusEnum.WISH).order_by("-edited_time")
        wish_books_more = True if wish_book_marks.count() > BOOKS_PER_SET else False
        
        collect_book_marks = request.user.user_bookmarks.filter(
            status=MarkStatusEnum.COLLECT).order_by("-edited_time")
        collect_books_more = True if collect_book_marks.count() > BOOKS_PER_SET else False


        do_movie_marks = request.user.user_moviemarks.filter(
            status=MarkStatusEnum.DO).order_by("-edited_time")
        do_movies_more = True if do_movie_marks.count() > MOVIES_PER_SET else False

        wish_movie_marks = request.user.user_moviemarks.filter(
            status=MarkStatusEnum.WISH).order_by("-edited_time")
        wish_movies_more = True if wish_movie_marks.count() > MOVIES_PER_SET else False
        
        collect_movie_marks = request.user.user_moviemarks.filter(
            status=MarkStatusEnum.COLLECT).order_by("-edited_time")
        collect_movies_more = True if collect_movie_marks.count() > MOVIES_PER_SET else False

        do_music_marks = list(request.user.user_songmarks.filter(status=MarkStatusEnum.DO)[:MUSIC_PER_SET]) \
            + list(request.user.user_albummarks.filter(status=MarkStatusEnum.DO)[:MUSIC_PER_SET])
        do_music_more = True if len(do_music_marks) > MUSIC_PER_SET else False
        do_music_marks = sorted(do_music_marks, key=lambda e: e.edited_time, reverse=True)[:MUSIC_PER_SET]

        wish_music_marks = list(request.user.user_songmarks.filter(status=MarkStatusEnum.WISH)[:MUSIC_PER_SET]) \
            + list(request.user.user_albummarks.filter(status=MarkStatusEnum.WISH)[:MUSIC_PER_SET])
        wish_music_more = True if len(wish_music_marks) > MUSIC_PER_SET else False
        wish_music_marks = sorted(wish_music_marks, key=lambda e: e.edited_time, reverse=True)[:MUSIC_PER_SET]

        collect_music_marks = list(request.user.user_songmarks.filter(status=MarkStatusEnum.COLLECT)[:MUSIC_PER_SET]) \
            + list(request.user.user_albummarks.filter(status=MarkStatusEnum.COLLECT)[:MUSIC_PER_SET])
        collect_music_more = True if len(collect_music_marks) > MUSIC_PER_SET else False
        collect_music_marks = sorted(collect_music_marks, key=lambda e: e.edited_time, reverse=True)[:MUSIC_PER_SET]

        for mark in do_music_marks + wish_music_marks + collect_music_marks:
            # for template convenience
            if mark.__class__ == AlbumMark:
                mark.type = "album"
            else:
                mark.type = "song"

        reports = Report.objects.order_by('-submitted_time').filter(is_read=False)
        # reports = Report.objects.latest('submitted_time').filter(is_read=False)

        return render(
            request,
            'common/home.html',
            {
                'do_book_marks': do_book_marks[:BOOKS_PER_SET],
                'wish_book_marks': wish_book_marks[:BOOKS_PER_SET],
                'collect_book_marks': collect_book_marks[:BOOKS_PER_SET],
                'do_books_more': do_books_more,
                'wish_books_more': wish_books_more,
                'collect_books_more': collect_books_more,
                'do_movie_marks': do_movie_marks[:MOVIES_PER_SET],
                'wish_movie_marks': wish_movie_marks[:MOVIES_PER_SET],
                'collect_movie_marks': collect_movie_marks[:MOVIES_PER_SET],
                'do_movies_more': do_movies_more,
                'wish_movies_more': wish_movies_more,
                'collect_movies_more': collect_movies_more,
                'do_music_marks': do_music_marks,
                'wish_music_marks': wish_music_marks,
                'collect_music_marks': collect_music_marks,
                'do_music_more': do_music_more,
                'wish_music_more': wish_music_more,
                'collect_music_more': collect_music_more,
                'reports': reports,
                'unread_announcements': unread_announcements,
            }
        )
    else:
        return HttpResponseBadRequest()


@login_required
def search(request):
    if request.method == 'GET':

        # test if input serach string is empty or not excluding param ?c=
        empty_querystring_criteria = {k: v for k, v in request.GET.items() if k != 'c'}
        if not len(empty_querystring_criteria):
            return HttpResponseBadRequest()

        # test if user input an URL, if so jump to URL handling function
        url_validator = URLValidator()
        input_string = request.GET.get('q', default='').strip()
        try:
            url_validator(input_string)
            # validation success
            return jump_or_scrape(request, input_string)
        except ValidationError as e:
            pass

        # category, book/movie/music etc
        category = request.GET.get("c", default='').strip().lower()
        # keywords, seperated by blank space
        keywords = request.GET.get("q", default='').strip().split()
        # tag, when tag is provided there should be no keywords , for now
        tag = request.GET.get("tag", default='')

        # white space string, empty query
        if not (keywords or tag):
            return []

        def book_param_handler(**kwargs):
            # keywords
            keywords = kwargs.get('keywords')
            # tag
            tag = kwargs.get('tag')

            query_args = []
            q = Q()

            for keyword in keywords:
                q = q | Q(title__icontains=keyword)
                q = q | Q(subtitle__icontains=keyword)
                q = q | Q(orig_title__icontains=keyword)
            if tag:
                q = q & Q(book_tags__content__iexact=tag)

            query_args.append(q)
            queryset = Book.objects.filter(*query_args).distinct()

            def calculate_similarity(book):
                if keywords:
                    # search by keywords
                    similarity, n = 0, 0
                    for keyword in keywords:
                        similarity += 1/2 * SequenceMatcher(None, keyword, book.title).quick_ratio() 
                        + 1/3 * SequenceMatcher(None, keyword, book.orig_title).quick_ratio()
                        + 1/6 * SequenceMatcher(None, keyword, book.subtitle).quick_ratio()
                        n += 1
                    book.similarity = similarity / n

                elif tag:
                    # search by single tag
                    book.similarity = 0 if book.rating_number is None else book.rating_number
                else:
                    book.similarity = 0
                return book.similarity
            if len(queryset) > 0:
                ordered_queryset = sorted(queryset, key=calculate_similarity, reverse=True)
            else:
                ordered_queryset = list(queryset)
            return ordered_queryset
            
        def movie_param_handler(**kwargs):
            # keywords
            keywords = kwargs.get('keywords')
            # tag
            tag = kwargs.get('tag')

            query_args = []
            q = Q()

            for keyword in keywords:
                q = q | Q(title__icontains=keyword)
                q = q | Q(other_title__icontains=keyword)
                q = q | Q(orig_title__icontains=keyword)
            if tag:
                q = q & Q(movie_tags__content__iexact=tag)

            query_args.append(q)
            queryset = Movie.objects.filter(*query_args).distinct()

            def calculate_similarity(movie):
                if keywords:
                    # search by name
                    similarity, n = 0, 0
                    for keyword in keywords:
                        similarity += 1/2 * SequenceMatcher(None, keyword, movie.title).quick_ratio()
                        + 1/4 * SequenceMatcher(None, keyword, movie.orig_title).quick_ratio()
                        + 1/4 * SequenceMatcher(None, keyword, movie.other_title).quick_ratio()
                        n += 1
                    movie.similarity = similarity / n
                elif tag:
                    # search by single tag
                    movie.similarity = 0 if movie.rating_number is None else movie.rating_number
                else:
                    movie.similarity = 0
                return movie.similarity
            if len(queryset) > 0:
                ordered_queryset = sorted(queryset, key=calculate_similarity, reverse=True)
            else:
                ordered_queryset = list(queryset)
            return ordered_queryset

        def music_param_handler(**kwargs):
            # keywords
            keywords = kwargs.get('keywords')
            # tag
            tag = kwargs.get('tag')

            query_args = []
            q = Q()

            # search albums
            for keyword in keywords:
                q = q | Q(title__icontains=keyword)
                q = q | Q(artist__icontains=keyword)
            if tag:
                q = q & Q(album_tags__content__iexact=tag)

            query_args.append(q)
            album_queryset = Album.objects.filter(*query_args).distinct()

            # extra query args for songs
            q = Q()
            for keyword in keywords:
                q = q | Q(album__title__icontains=keyword)
                q = q | Q(title__icontains=keyword)
                q = q | Q(artist__icontains=keyword)
            if tag:
                q = q & Q(song_tags__content__iexact=tag)
            query_args.clear()
            query_args.append(q)
            song_queryset = Song.objects.filter(*query_args).distinct()
            queryset = list(album_queryset) + list(song_queryset)

            def calculate_similarity(music):
                if keywords:
                    # search by name
                    similarity, n = 0, 0
                    artist_dump = ' '.join(music.artist)
                    for keyword in keywords:
                        if music.__class__ == Album:
                            similarity += 1/2 * SequenceMatcher(None, keyword, music.title).quick_ratio() \
                                + 1/2 * SequenceMatcher(None, keyword, artist_dump).quick_ratio()
                        elif music.__class__ == Song:
                            similarity += 1/2 * SequenceMatcher(None, keyword, music.title).quick_ratio() \
                                + 1/6 * SequenceMatcher(None, keyword, artist_dump).quick_ratio() \
                                + 1/6 * SequenceMatcher(None, keyword, music.album.title).quick_ratio()
                        n += 1
                    music.similarity = similarity / n
                elif tag:
                    # search by single tag
                    music.similarity = 0 if music.rating_number is None else music.rating_number
                else:
                    music.similarity = 0
                return music.similarity
            if len(queryset) > 0:
                ordered_queryset = sorted(queryset, key=calculate_similarity, reverse=True)
            else:
                ordered_queryset = list(queryset)
            return ordered_queryset

        def all_param_handler(**kwargs):
            book_queryset = book_param_handler(**kwargs)
            movie_queryset = movie_param_handler(**kwargs)
            music_queryset = music_param_handler(**kwargs)
            ordered_queryset = sorted(
                book_queryset + movie_queryset + music_queryset, 
                key=operator.attrgetter('similarity'), 
                reverse=True
            )
            return ordered_queryset

        param_handler = {
            'book': book_param_handler,
            'movie': movie_param_handler,
            'music': music_param_handler,
            'all': all_param_handler,
            '': all_param_handler
        }

        try:
            queryset = param_handler[category](
                keywords=keywords,
                tag=tag
            )
        except KeyError as e:
            queryset = param_handler['all'](
                keywords=keywords,
                tag=tag
            )
        paginator = Paginator(queryset, ITEMS_PER_PAGE)
        page_number = request.GET.get('page', default=1)
        items = paginator.get_page(page_number)
        items.pagination = PageLinksGenerator(PAGE_LINK_NUMBER, page_number, paginator.num_pages)
        for item in items:
            item.tag_list = item.get_tags_manager().values('content').annotate(
                tag_frequency=Count('content')).order_by('-tag_frequency')[:TAG_NUMBER_ON_LIST]

        return render(
            request,
            "common/search_result.html",
            {
                "items": items,
            }
        )

    else:
        return HttpResponseBadRequest()


@login_required
@mastodon_request_included
def jump_or_scrape(request, url):
    """
    1. match url to registered scrapers
    2. try to find the url in the db, if exits then jump, else scrape and jump
    """

    # redirect to this site
    this_site = request.get_host()
    if this_site in url:
        return redirect(url)

    # match url to registerd sites
    matched_host = None
    for host in scraper_registry:
        if host in url:
            matched_host = host
            break

    if matched_host is None:
        # invalid url
        return render(request, 'common/error.html', {'msg': _("链接非法，查询失败")})
    else:
        scraper = scraper_registry[matched_host]
        try:
            # raise ObjectDoesNotExist
            effective_url = scraper.get_effective_url(url)
            entity = scraper.data_class.objects.get(source_url=effective_url)
            # if exists then jump to detail page
            return redirect(entity)
        except ObjectDoesNotExist:
            # scrape if not exists
            try:
                scraper.scrape(url)
                form = scraper.save(request_user=request.user)
            except Exception as e:
                logger.error(f"Scrape Failed URL: {url}")
                logger.error("Expections during saving scraped data:", exc_info=e)
                return render(request, 'common/error.html', {'msg': _("爬取数据失败😫")})
            return redirect(form.instance)
finish complete movie app 2020-10-04 16:16:50 +02:00			`import operator`
add backend support for multiple entity sources 2020-11-23 23:18:14 +01:00			`import logging`
finish complete movie app 2020-10-04 16:16:50 +02:00			`from difflib import SequenceMatcher`
add backend support for multiple entity sources 2020-11-23 23:18:14 +01:00			`from urllib.parse import urlparse`
			`from django.shortcuts import render, redirect, reverse`
first commit 2020-05-01 22:46:15 +08:00			`from django.contrib.auth.decorators import login_required`
add backend support for multiple entity sources 2020-11-23 23:18:14 +01:00			`from django.utils.translation import gettext_lazy as _`
			`from django.core.paginator import Paginator`
			`from django.core.validators import URLValidator`
			`from django.core.exceptions import ValidationError, ObjectDoesNotExist`
			`from django.db.models import Q, Count`
			`from django.http import HttpResponseBadRequest`
first commit 2020-05-01 22:46:15 +08:00			`from books.models import Book`
finish complete movie app 2020-10-04 16:16:50 +02:00			`from movies.models import Movie`
finish music part 2021-02-15 21:27:50 +01:00			`from music.models import Album, Song, AlbumMark, SongMark`
add backend support for multiple entity sources 2020-11-23 23:18:14 +01:00			`from users.models import Report, User`
			`from mastodon.decorators import mastodon_request_included`
first commit 2020-05-01 22:46:15 +08:00			`from common.models import MarkStatusEnum`
restructure css 2020-07-03 15:36:23 +08:00			`from common.utils import PageLinksGenerator`
add backend support for multiple entity sources 2020-11-23 23:18:14 +01:00			`from common.scraper import scraper_registry`
add announcement module 2020-12-09 13:47:00 +01:00			`from management.models import Announcement`
first commit 2020-05-01 22:46:15 +08:00

			`# how many books have in each set at the home page`
			`BOOKS_PER_SET = 5`

finish independent movie app 2020-10-03 23:27:41 +02:00			`# how many movies have in each set at the home page`
			`MOVIES_PER_SET = 5`

finish music part 2021-02-15 21:27:50 +01:00			`MUSIC_PER_SET = 5`

first commit 2020-05-01 22:46:15 +08:00			`# how many items are showed in one search result page`
			`ITEMS_PER_PAGE = 20`

restructure css 2020-07-03 15:36:23 +08:00			`# how many pages links in the pagination`
			`PAGE_LINK_NUMBER = 7`

add tag feature \| close #19 2020-07-10 21:28:09 +08:00			`# max tags on list page`
			`TAG_NUMBER_ON_LIST = 5`

add backend support for multiple entity sources 2020-11-23 23:18:14 +01:00			`logger = logging.getLogger(__name__)`
first commit 2020-05-01 22:46:15 +08:00
			`@login_required`
			`def home(request):`
			`if request.method == 'GET':`

finish music part 2021-02-15 21:27:50 +01:00			`# really shitty code here`

add announcement module 2020-12-09 13:47:00 +01:00			`unread_announcements = Announcement.objects.filter(`
			`pk__gt=request.user.read_announcement_index).order_by('-pk')`
fix initial state of announcement 2020-12-09 13:59:59 +01:00			`try:`
			`request.user.read_announcement_index = Announcement.objects.latest('pk').pk`
			`request.user.save(update_fields=['read_announcement_index'])`
			`except ObjectDoesNotExist as e:`
			`# when there is no annoucenment`
			`pass`
add announcement module 2020-12-09 13:47:00 +01:00
reverse mark display order 2020-07-23 13:36:00 +08:00			`do_book_marks = request.user.user_bookmarks.filter(`
			`status=MarkStatusEnum.DO).order_by("-edited_time")`
second commit 2020-05-05 23:50:48 +08:00			`do_books_more = True if do_book_marks.count() > BOOKS_PER_SET else False`

reverse mark display order 2020-07-23 13:36:00 +08:00			`wish_book_marks = request.user.user_bookmarks.filter(`
			`status=MarkStatusEnum.WISH).order_by("-edited_time")`
second commit 2020-05-05 23:50:48 +08:00			`wish_books_more = True if wish_book_marks.count() > BOOKS_PER_SET else False`

reverse mark display order 2020-07-23 13:36:00 +08:00			`collect_book_marks = request.user.user_bookmarks.filter(`
			`status=MarkStatusEnum.COLLECT).order_by("-edited_time")`
second commit 2020-05-05 23:50:48 +08:00			`collect_books_more = True if collect_book_marks.count() > BOOKS_PER_SET else False`
first commit 2020-05-01 22:46:15 +08:00
finish independent movie app 2020-10-03 23:27:41 +02:00
			`do_movie_marks = request.user.user_moviemarks.filter(`
			`status=MarkStatusEnum.DO).order_by("-edited_time")`
			`do_movies_more = True if do_movie_marks.count() > MOVIES_PER_SET else False`

			`wish_movie_marks = request.user.user_moviemarks.filter(`
			`status=MarkStatusEnum.WISH).order_by("-edited_time")`
			`wish_movies_more = True if wish_movie_marks.count() > MOVIES_PER_SET else False`

			`collect_movie_marks = request.user.user_moviemarks.filter(`
			`status=MarkStatusEnum.COLLECT).order_by("-edited_time")`
			`collect_movies_more = True if collect_movie_marks.count() > MOVIES_PER_SET else False`

finish music part 2021-02-15 21:27:50 +01:00			`do_music_marks = list(request.user.user_songmarks.filter(status=MarkStatusEnum.DO)[:MUSIC_PER_SET]) \`
			`+ list(request.user.user_albummarks.filter(status=MarkStatusEnum.DO)[:MUSIC_PER_SET])`
			`do_music_more = True if len(do_music_marks) > MUSIC_PER_SET else False`
			`do_music_marks = sorted(do_music_marks, key=lambda e: e.edited_time, reverse=True)[:MUSIC_PER_SET]`

			`wish_music_marks = list(request.user.user_songmarks.filter(status=MarkStatusEnum.WISH)[:MUSIC_PER_SET]) \`
			`+ list(request.user.user_albummarks.filter(status=MarkStatusEnum.WISH)[:MUSIC_PER_SET])`
			`wish_music_more = True if len(wish_music_marks) > MUSIC_PER_SET else False`
			`wish_music_marks = sorted(wish_music_marks, key=lambda e: e.edited_time, reverse=True)[:MUSIC_PER_SET]`

			`collect_music_marks = list(request.user.user_songmarks.filter(status=MarkStatusEnum.COLLECT)[:MUSIC_PER_SET]) \`
			`+ list(request.user.user_albummarks.filter(status=MarkStatusEnum.COLLECT)[:MUSIC_PER_SET])`
			`collect_music_more = True if len(collect_music_marks) > MUSIC_PER_SET else False`
			`collect_music_marks = sorted(collect_music_marks, key=lambda e: e.edited_time, reverse=True)[:MUSIC_PER_SET]`

			`for mark in do_music_marks + wish_music_marks + collect_music_marks:`
			`# for template convenience`
			`if mark.__class__ == AlbumMark:`
			`mark.type = "album"`
			`else:`
			`mark.type = "song"`

first commit 2020-05-01 22:46:15 +08:00			`reports = Report.objects.order_by('-submitted_time').filter(is_read=False)`
			`# reports = Report.objects.latest('submitted_time').filter(is_read=False)`

			`return render(`
			`request,`
			`'common/home.html',`
			`{`
second commit 2020-05-05 23:50:48 +08:00			`'do_book_marks': do_book_marks[:BOOKS_PER_SET],`
			`'wish_book_marks': wish_book_marks[:BOOKS_PER_SET],`
			`'collect_book_marks': collect_book_marks[:BOOKS_PER_SET],`
first commit 2020-05-01 22:46:15 +08:00			`'do_books_more': do_books_more,`
			`'wish_books_more': wish_books_more,`
			`'collect_books_more': collect_books_more,`
finish independent movie app 2020-10-03 23:27:41 +02:00			`'do_movie_marks': do_movie_marks[:MOVIES_PER_SET],`
			`'wish_movie_marks': wish_movie_marks[:MOVIES_PER_SET],`
			`'collect_movie_marks': collect_movie_marks[:MOVIES_PER_SET],`
			`'do_movies_more': do_movies_more,`
			`'wish_movies_more': wish_movies_more,`
			`'collect_movies_more': collect_movies_more,`
finish music part 2021-02-15 21:27:50 +01:00			`'do_music_marks': do_music_marks,`
			`'wish_music_marks': wish_music_marks,`
			`'collect_music_marks': collect_music_marks,`
			`'do_music_more': do_music_more,`
			`'wish_music_more': wish_music_more,`
			`'collect_music_more': collect_music_more,`
first commit 2020-05-01 22:46:15 +08:00			`'reports': reports,`
add announcement module 2020-12-09 13:47:00 +01:00			`'unread_announcements': unread_announcements,`
first commit 2020-05-01 22:46:15 +08:00			`}`
			`)`
			`else:`
			`return HttpResponseBadRequest()`


second commit 2020-05-05 23:50:48 +08:00			`@login_required`
first commit 2020-05-01 22:46:15 +08:00			`def search(request):`
			`if request.method == 'GET':`

add backend support for multiple entity sources 2020-11-23 23:18:14 +01:00			`# test if input serach string is empty or not excluding param ?c=`
fix tag search error 2020-10-15 11:52:59 +02:00			`empty_querystring_criteria = {k: v for k, v in request.GET.items() if k != 'c'}`
			`if not len(empty_querystring_criteria):`
fix more actor separator display issue 2020-10-04 19:37:20 +02:00			`return HttpResponseBadRequest()`

add backend support for multiple entity sources 2020-11-23 23:18:14 +01:00			`# test if user input an URL, if so jump to URL handling function`
			`url_validator = URLValidator()`
fix bug of searching based on tags 2020-11-28 01:50:38 +01:00			`input_string = request.GET.get('q', default='').strip()`
add backend support for multiple entity sources 2020-11-23 23:18:14 +01:00			`try:`
			`url_validator(input_string)`
			`# validation success`
			`return jump_or_scrape(request, input_string)`
			`except ValidationError as e:`
			`pass`

Implement basic Music functions 2021-02-12 19:23:23 +01:00			`# category, book/movie/music etc`
finish complete movie app 2020-10-04 16:16:50 +02:00			`category = request.GET.get("c", default='').strip().lower()`
finish music part 2021-02-15 21:27:50 +01:00			`# keywords, seperated by blank space`
			`keywords = request.GET.get("q", default='').strip().split()`
			`# tag, when tag is provided there should be no keywords , for now`
			`tag = request.GET.get("tag", default='')`
finish complete movie app 2020-10-04 16:16:50 +02:00
finish music part 2021-02-15 21:27:50 +01:00			`# white space string, empty query`
			`if not (keywords or tag):`
			`return []`
Implement basic Music functions 2021-02-12 19:23:23 +01:00
finish music part 2021-02-15 21:27:50 +01:00			`def book_param_handler(**kwargs):`
finish complete movie app 2020-10-04 16:16:50 +02:00			`# keywords`
finish music part 2021-02-15 21:27:50 +01:00			`keywords = kwargs.get('keywords')`
Implement basic Music functions 2021-02-12 19:23:23 +01:00			`# tag`
finish music part 2021-02-15 21:27:50 +01:00			`tag = kwargs.get('tag')`
Implement basic Music functions 2021-02-12 19:23:23 +01:00
finish music part 2021-02-15 21:27:50 +01:00			`query_args = []`
			`q = Q()`
finish complete movie app 2020-10-04 16:16:50 +02:00
finish music part 2021-02-15 21:27:50 +01:00			`for keyword in keywords:`
finish complete movie app 2020-10-04 16:16:50 +02:00			`q = q \| Q(title__icontains=keyword)`
			`q = q \| Q(subtitle__icontains=keyword)`
			`q = q \| Q(orig_title__icontains=keyword)`
			`if tag:`
			`q = q & Q(book_tags__content__iexact=tag)`

			`query_args.append(q)`
			`queryset = Book.objects.filter(*query_args).distinct()`

			`def calculate_similarity(book):`
fix tag search error 2020-10-15 11:52:59 +02:00			`if keywords:`
			`# search by keywords`
			`similarity, n = 0, 0`
			`for keyword in keywords:`
			`similarity += 1/2 * SequenceMatcher(None, keyword, book.title).quick_ratio()`
			`+ 1/3 * SequenceMatcher(None, keyword, book.orig_title).quick_ratio()`
			`+ 1/6 * SequenceMatcher(None, keyword, book.subtitle).quick_ratio()`
			`n += 1`
			`book.similarity = similarity / n`

			`elif tag:`
			`# search by single tag`
			`book.similarity = 0 if book.rating_number is None else book.rating_number`
Implement basic Music functions 2021-02-12 19:23:23 +01:00			`else:`
			`book.similarity = 0`
finish complete movie app 2020-10-04 16:16:50 +02:00			`return book.similarity`
fix empty search result divided by 0 bug 2020-10-15 11:08:29 +02:00			`if len(queryset) > 0:`
			`ordered_queryset = sorted(queryset, key=calculate_similarity, reverse=True)`
			`else:`
fix tag search error 2020-10-15 11:52:59 +02:00			`ordered_queryset = list(queryset)`
finish complete movie app 2020-10-04 16:16:50 +02:00			`return ordered_queryset`

finish music part 2021-02-15 21:27:50 +01:00			`def movie_param_handler(**kwargs):`
finish complete movie app 2020-10-04 16:16:50 +02:00			`# keywords`
finish music part 2021-02-15 21:27:50 +01:00			`keywords = kwargs.get('keywords')`
Implement basic Music functions 2021-02-12 19:23:23 +01:00			`# tag`
finish music part 2021-02-15 21:27:50 +01:00			`tag = kwargs.get('tag')`
Implement basic Music functions 2021-02-12 19:23:23 +01:00
finish music part 2021-02-15 21:27:50 +01:00			`query_args = []`
			`q = Q()`
finish complete movie app 2020-10-04 16:16:50 +02:00
finish music part 2021-02-15 21:27:50 +01:00			`for keyword in keywords:`
finish complete movie app 2020-10-04 16:16:50 +02:00			`q = q \| Q(title__icontains=keyword)`
			`q = q \| Q(other_title__icontains=keyword)`
			`q = q \| Q(orig_title__icontains=keyword)`
			`if tag:`
			`q = q & Q(movie_tags__content__iexact=tag)`

			`query_args.append(q)`
			`queryset = Movie.objects.filter(*query_args).distinct()`

			`def calculate_similarity(movie):`
fix tag search error 2020-10-15 11:52:59 +02:00			`if keywords:`
			`# search by name`
			`similarity, n = 0, 0`
			`for keyword in keywords:`
			`similarity += 1/2 * SequenceMatcher(None, keyword, movie.title).quick_ratio()`
			`+ 1/4 * SequenceMatcher(None, keyword, movie.orig_title).quick_ratio()`
			`+ 1/4 * SequenceMatcher(None, keyword, movie.other_title).quick_ratio()`
			`n += 1`
			`movie.similarity = similarity / n`
			`elif tag:`
			`# search by single tag`
			`movie.similarity = 0 if movie.rating_number is None else movie.rating_number`
Implement basic Music functions 2021-02-12 19:23:23 +01:00			`else:`
			`movie.similarity = 0`
finish complete movie app 2020-10-04 16:16:50 +02:00			`return movie.similarity`
fix empty search result divided by 0 bug 2020-10-15 11:08:29 +02:00			`if len(queryset) > 0:`
			`ordered_queryset = sorted(queryset, key=calculate_similarity, reverse=True)`
			`else:`
fix tag search error 2020-10-15 11:52:59 +02:00			`ordered_queryset = list(queryset)`
finish complete movie app 2020-10-04 16:16:50 +02:00			`return ordered_queryset`

finish music part 2021-02-15 21:27:50 +01:00			`def music_param_handler(**kwargs):`
Implement basic Music functions 2021-02-12 19:23:23 +01:00			`# keywords`
finish music part 2021-02-15 21:27:50 +01:00			`keywords = kwargs.get('keywords')`
Implement basic Music functions 2021-02-12 19:23:23 +01:00			`# tag`
finish music part 2021-02-15 21:27:50 +01:00			`tag = kwargs.get('tag')`
Implement basic Music functions 2021-02-12 19:23:23 +01:00
finish music part 2021-02-15 21:27:50 +01:00			`query_args = []`
			`q = Q()`
Implement basic Music functions 2021-02-12 19:23:23 +01:00
			`# search albums`
finish music part 2021-02-15 21:27:50 +01:00			`for keyword in keywords:`
Implement basic Music functions 2021-02-12 19:23:23 +01:00			`q = q \| Q(title__icontains=keyword)`
finish music part 2021-02-15 21:27:50 +01:00			`q = q \| Q(artist__icontains=keyword)`
Implement basic Music functions 2021-02-12 19:23:23 +01:00			`if tag:`
			`q = q & Q(album_tags__content__iexact=tag)`

			`query_args.append(q)`
finish music part 2021-02-15 21:27:50 +01:00			`album_queryset = Album.objects.filter(*query_args).distinct()`

			`# extra query args for songs`
			`q = Q()`
			`for keyword in keywords:`
			`q = q \| Q(album__title__icontains=keyword)`
			`q = q \| Q(title__icontains=keyword)`
			`q = q \| Q(artist__icontains=keyword)`
			`if tag:`
			`q = q & Q(song_tags__content__iexact=tag)`
			`query_args.clear()`
			`query_args.append(q)`
			`song_queryset = Song.objects.filter(*query_args).distinct()`
			`queryset = list(album_queryset) + list(song_queryset)`
Implement basic Music functions 2021-02-12 19:23:23 +01:00
			`def calculate_similarity(music):`
			`if keywords:`
			`# search by name`
			`similarity, n = 0, 0`
finish music part 2021-02-15 21:27:50 +01:00			`artist_dump = ' '.join(music.artist)`
Implement basic Music functions 2021-02-12 19:23:23 +01:00			`for keyword in keywords:`
finish music part 2021-02-15 21:27:50 +01:00			`if music.__class__ == Album:`
			`similarity += 1/2 * SequenceMatcher(None, keyword, music.title).quick_ratio() \`
			`+ 1/2 * SequenceMatcher(None, keyword, artist_dump).quick_ratio()`
			`elif music.__class__ == Song:`
			`similarity += 1/2 * SequenceMatcher(None, keyword, music.title).quick_ratio() \`
			`+ 1/6 * SequenceMatcher(None, keyword, artist_dump).quick_ratio() \`
			`+ 1/6 * SequenceMatcher(None, keyword, music.album.title).quick_ratio()`
Implement basic Music functions 2021-02-12 19:23:23 +01:00			`n += 1`
			`music.similarity = similarity / n`
			`elif tag:`
			`# search by single tag`
			`music.similarity = 0 if music.rating_number is None else music.rating_number`
			`else:`
			`music.similarity = 0`
			`return music.similarity`
			`if len(queryset) > 0:`
			`ordered_queryset = sorted(queryset, key=calculate_similarity, reverse=True)`
			`else:`
			`ordered_queryset = list(queryset)`
			`return ordered_queryset`

finish music part 2021-02-15 21:27:50 +01:00			`def all_param_handler(**kwargs):`
			`book_queryset = book_param_handler(**kwargs)`
			`movie_queryset = movie_param_handler(**kwargs)`
			`music_queryset = music_param_handler(**kwargs)`
finish complete movie app 2020-10-04 16:16:50 +02:00			`ordered_queryset = sorted(`
Implement basic Music functions 2021-02-12 19:23:23 +01:00			`book_queryset + movie_queryset + music_queryset,`
finish complete movie app 2020-10-04 16:16:50 +02:00			`key=operator.attrgetter('similarity'),`
			`reverse=True`
			`)`
			`return ordered_queryset`

			`param_handler = {`
			`'book': book_param_handler,`
			`'movie': movie_param_handler,`
Implement basic Music functions 2021-02-12 19:23:23 +01:00			`'music': music_param_handler,`
finish complete movie app 2020-10-04 16:16:50 +02:00			`'all': all_param_handler,`
			`'': all_param_handler`
			`}`

			`try:`
finish music part 2021-02-15 21:27:50 +01:00			`queryset = param_handler[category](`
			`keywords=keywords,`
			`tag=tag`
			`)`
finish complete movie app 2020-10-04 16:16:50 +02:00			`except KeyError as e:`
finish music part 2021-02-15 21:27:50 +01:00			`queryset = param_handler['all'](`
			`keywords=keywords,`
			`tag=tag`
			`)`
first commit 2020-05-01 22:46:15 +08:00			`paginator = Paginator(queryset, ITEMS_PER_PAGE)`
			`page_number = request.GET.get('page', default=1)`
			`items = paginator.get_page(page_number)`
restructure css 2020-07-03 15:36:23 +08:00			`items.pagination = PageLinksGenerator(PAGE_LINK_NUMBER, page_number, paginator.num_pages)`
add tag feature \| close #19 2020-07-10 21:28:09 +08:00			`for item in items:`
			`item.tag_list = item.get_tags_manager().values('content').annotate(`
			`tag_frequency=Count('content')).order_by('-tag_frequency')[:TAG_NUMBER_ON_LIST]`
first commit 2020-05-01 22:46:15 +08:00
			`return render(`
			`request,`
			`"common/search_result.html",`
			`{`
			`"items": items,`
			`}`
			`)`

			`else:`
add tag feature \| close #19 2020-07-10 21:28:09 +08:00			`return HttpResponseBadRequest()`
add backend support for multiple entity sources 2020-11-23 23:18:14 +01:00

			`@login_required`
			`@mastodon_request_included`
			`def jump_or_scrape(request, url):`
			`"""`
			`1. match url to registered scrapers`
			`2. try to find the url in the db, if exits then jump, else scrape and jump`
			`"""`

			`# redirect to this site`
			`this_site = request.get_host()`
			`if this_site in url:`
			`return redirect(url)`

			`# match url to registerd sites`
			`matched_host = None`
			`for host in scraper_registry:`
			`if host in url:`
			`matched_host = host`
			`break`

			`if matched_host is None:`
			`# invalid url`
			`return render(request, 'common/error.html', {'msg': _("链接非法，查询失败")})`
			`else:`
			`scraper = scraper_registry[matched_host]`
			`try:`
			`# raise ObjectDoesNotExist`
fix jump failure when url has querystring 2020-11-28 01:40:22 +01:00			`effective_url = scraper.get_effective_url(url)`
			`entity = scraper.data_class.objects.get(source_url=effective_url)`
add backend support for multiple entity sources 2020-11-23 23:18:14 +01:00			`# if exists then jump to detail page`
			`return redirect(entity)`
			`except ObjectDoesNotExist:`
			`# scrape if not exists`
			`try:`
finish music part 2021-02-15 21:27:50 +01:00			`scraper.scrape(url)`
			`form = scraper.save(request_user=request.user)`
			`except Exception as e:`
			`logger.error(f"Scrape Failed URL: {url}")`
			`logger.error("Expections during saving scraped data:", exc_info=e)`
add backend support for multiple entity sources 2020-11-23 23:18:14 +01:00			`return render(request, 'common/error.html', {'msg': _("爬取数据失败😫")})`
finish music part 2021-02-15 21:27:50 +01:00			`return redirect(form.instance)`