remove legacy code for 0.8 migration

2024-06-11 18:48:29 -04:00 · 2024-06-11 18:48:29 -04:00 · fec333c90f
commit fec333c90f
parent faf89b6249
2 changed files with 5 additions and 221 deletions
--- a/takahe/management/commands/backfill_takahe.py
+++ b/takahe/management/commands/backfill_takahe.py
@ -1,201 +0,0 @@
-import time
-from contextlib import nullcontext
-from datetime import datetime
-from datetime import timezone as dttz
-
-from django.conf import settings
-from django.contrib.contenttypes.models import ContentType
-from django.core.management.base import BaseCommand
-from django.core.paginator import Paginator
-from django.db.models import Count, F
-from loguru import logger
-from tqdm import tqdm
-
-from catalog.common import *
-from catalog.common.models import *
-from catalog.models import PodcastEpisode, TVEpisode
-from journal.models import *
-from takahe.models import Identity as TakaheIdentity
-from takahe.models import Post as TakahePost
-from takahe.models import TimelineEvent, set_migration_mode
-from takahe.utils import *
-from users.models import APIdentity
-from users.models import User as NeoUser
-
-BATCH_SIZE = 1000
-
-TIMELINE_START = datetime.datetime(2023, 7, 1, tzinfo=dttz.utc)
-
-
-def content_type_id(cls):
-    return ContentType.objects.get(app_label="journal", model=cls.__name__.lower()).pk
-
-
-class Command(BaseCommand):
-    def add_arguments(self, parser):
-        parser.add_argument(
-            "--verbose",
-            action="store_true",
-        )
-        parser.add_argument(
-            "--post",
-            action="store_true",
-        )
-        parser.add_argument(
-            "--timeline",
-            action="store_true",
-        )
-        parser.add_argument(
-            "--like",
-            action="store_true",
-        )
-        parser.add_argument(
-            "--post-new",
-            action="store_true",
-        )
-        parser.add_argument(
-            "--csv",
-            action="store_true",
-        )
-        parser.add_argument("--start", default=0, action="store")
-        parser.add_argument("--count", default=0, action="store")
-
-    def process_post(self):
-        def batch(pieces, tracker):
-            with transaction.atomic(using="default"):
-                with transaction.atomic(using="takahe"):
-                    for p in pieces:
-                        if p.__class__ == ShelfMember:
-                            mark = Mark(p.owner, p.item)
-                            Takahe.post_mark(mark, self.post_new)
-                        elif p.__class__ == Comment:
-                            if p.item.__class__ in [PodcastEpisode, TVEpisode]:
-                                Takahe.post_comment(p, self.post_new)
-                        elif p.__class__ == Review:
-                            Takahe.post_review(p, self.post_new)
-                        elif p.__class__ == Collection:
-                            Takahe.post_collection(p)
-                    tracker.set_postfix_str(str(pieces[-1].pk))
-                    tracker.update(len(pieces))
-
-        logger.info(f"Generating posts...")
-        set_migration_mode(True)
-        qs = Piece.objects.filter(
-            polymorphic_ctype__in=[
-                content_type_id(ShelfMember),
-                content_type_id(Comment),
-                content_type_id(Review),
-                content_type_id(Collection),
-            ]
-        ).order_by("id")
-        if self.starting_id:
-            qs = qs.filter(id__gte=self.starting_id)
-        tracker = tqdm(total=self.count_est or qs.count())
-        pieces = []
-        for piece in qs.iterator():
-            pieces.append(piece)
-            if len(pieces) >= BATCH_SIZE:
-                batch(pieces, tracker)
-                pieces = []
-        if pieces:
-            batch(pieces, tracker)
-        set_migration_mode(False)
-
-    def process_timeline(self):
-        def add_event(post_id, author_id, owner_id, published):
-            TimelineEvent.objects.get_or_create(
-                identity_id=owner_id,
-                type="post",
-                subject_post_id=post_id,
-                subject_identity_id=author_id,
-                defaults={
-                    "published": published,
-                },
-            )
-
-        logger.info(f"Generating identity cache for timeline...")
-        followers = {
-            apid.pk: apid.followers if apid.is_active else []
-            for apid in APIdentity.objects.filter(local=True)
-        }
-        qs = TakahePost.objects.filter(local=True).order_by("published")
-        cnt = qs.count()
-        # pg = Paginator(qs, BATCH_SIZE)
-        logger.info(f"Generating timeline...")
-        csv = ""
-        # for p in tqdm(pg.page_range):
-        #     with nullcontext() if self.csv else transaction.atomic(using="takahe"):
-        #         posts = pg.page(p)
-        events = []
-        for post in tqdm(qs.iterator(), total=cnt):
-            if self.csv:
-                csv += f"post,{post.author_id},{post.pk},{post.author_id},{post.published},{post.created},false,false\n"
-            else:
-                events.append(
-                    TimelineEvent(
-                        identity_id=post.author_id,
-                        type="post",
-                        subject_post_id=post.pk,
-                        subject_identity_id=post.author_id,
-                        published=post.published,
-                    )
-                )
-            if post.visibility != 3 and post.published > TIMELINE_START:
-                for follower_id in followers[post.author_id]:
-                    if self.csv:
-                        csv += f"post,{follower_id},{post.pk},{post.author_id},{post.published},{post.created},false,false\n"
-                    else:
-                        events.append(
-                            TimelineEvent(
-                                identity_id=follower_id,
-                                type="post",
-                                subject_post_id=post.pk,
-                                subject_identity_id=post.author_id,
-                                published=post.published,
-                            )
-                        )
-        if not self.csv:
-            TimelineEvent.objects.bulk_create(events, ignore_conflicts=True)
-            # for post in posts:
-            #     add_event(post.pk, post.author_id, post.author_id, post.published)
-            #     if post.visibility != 3:
-            #         for follower_id in followers[post.author_id]:
-            #             add_event(
-            #                 post.pk, post.author_id, follower_id, post.published
-            #             )
-        if self.csv:
-            logger.info(f"Writing timeline.csv...")
-            with open(settings.MEDIA_ROOT + "/timeline.csv", "w") as csvfile:
-                csvfile.write(
-                    "type,identity_id,subject_post_id,subject_identity_id,published,created,seen,dismissed\n"
-                )
-                csvfile.write(csv)
-
-    def process_like(self):
-        logger.info(f"Processing likes...")
-        qs = Like.objects.order_by("id")
-        tracker = tqdm(qs)
-        for like in tracker:
-            post_id = like.target.latest_post_id
-            if post_id:
-                Takahe.like_post(post_id, like.owner.pk)
-            else:
-                logger.warning(f"Post not found for {like.target.owner}:{like.target}")
-
-    def handle(self, *args, **options):
-        self.verbose = options["verbose"]
-        self.post_new = options["post_new"]
-        self.csv = options["csv"]
-        self.starting_id = int(options["start"])
-        self.count_est = int(options["count"])
-
-        if options["post"]:
-            self.process_post()
-
-        if options["timeline"]:
-            self.process_timeline()
-
-        if options["like"]:
-            self.process_like()
-
-        self.stdout.write(self.style.SUCCESS(f"Done."))
--- a/takahe/models.py
+++ b/takahe/models.py
@ -32,13 +32,6 @@ from .uris import *
 if TYPE_CHECKING:
    from django_stubs_ext.db.models.manager import RelatedManager

-_migration_mode = False
-
-
-def set_migration_mode(disable: bool):
-    global _migration_mode
-    _migration_mode = disable
-

 # class TakaheSession(models.Model):
 #     session_key = models.CharField(_("session key"), max_length=40, primary_key=True)
@ -1100,16 +1093,14 @@ class Post(models.Model):
    ) -> "Post":
        with transaction.atomic():
            # Find mentions in this post
-            mentions = (
-                set() if _migration_mode else cls.mentions_from_content(content, author)
-            )
+            mentions = cls.mentions_from_content(content, author)
            if reply_to:
                mentions.add(reply_to.author)
                # Maintain local-only for replies
                if reply_to.visibility == reply_to.Visibilities.local_only:
                    visibility = reply_to.Visibilities.local_only
            # Find emoji in this post
-            emojis = [] if _migration_mode else Emoji.emojis_from_content(content, None)
+            emojis = Emoji.emojis_from_content(content, None)
            # Strip all unwanted HTML and apply linebreaks filter, grabbing hashtags on the way
            parser = FediverseHtmlParser(linebreaks_filter(content), find_hashtags=True)
            content = parser.html.replace("<p>", "<p>" + raw_prepend_content, 1)
@ -1139,10 +1130,6 @@ class Post(models.Model):
            with transaction.atomic(using="takahe"):
                # Make the Post object
                post = cls.objects.create(**post_obj)
-
-                if _migration_mode:
-                    post.state = "fanned_out"
-                else:
                post.mentions.set(mentions)
                post.emojis.set(emojis)
                post.object_uri = post.urls.object_uri
@ -1158,7 +1145,7 @@ class Post(models.Model):
            # Recalculate parent stats for replies
            if reply_to:
                reply_to.calculate_stats()
-            if post.state == "fanned_out" and not _migration_mode:
+            if post.state == "fanned_out":
                # add post to auther's timeline directly if it's old
                post.add_to_timeline(author)
        return post
@ -1208,8 +1195,6 @@ class Post(models.Model):
            self.state_changed = timezone.now()
            self.state_next_attempt = None
            self.state_locked_until = None
-            if _migration_mode:  # NeoDB: disable fanout during migration
-                self.state = "edited_fanned_out"
            self.save()

    @classmethod