dosage/dosagelib/plugins/kemonocafe.py

# SPDX-License-Identifier: MIT
# SPDX-FileCopyrightText: © 2019 Tobias Gruetzmacher
# SPDX-FileCopyrightText: © 2019 Daniel Ring
from ..scraper import ParserScraper


class KemonoCafe(ParserScraper):
    imageSearch = '//div[@id="comic"]//img'
    prevSearch = '//a[contains(@class, "comic-nav-previous")]'

    def __init__(self, name, sub, first, last=None, adult=False):
        super(KemonoCafe, self).__init__('KemonoCafe/' + name)

        self.url = 'https://%s.kemono.cafe/' % sub
        self.stripUrl = self.url + 'comic/%s/'
        self.firstStripUrl = self.stripUrl % first

        if last:
            self.url = self.stripUrl % last
            self.endOfLife = True

        if adult:
            self.adult = True

    def namer(self, imageUrl, pageUrl):
        # Strip date from filenames
        filename = imageUrl.rsplit('/', 1)[-1]
        if 'ultrarosa' not in pageUrl:
            if filename[4] == '-' and filename[7] == '-':
                filename = filename[10:]
            if filename[0] == '-' or filename[0] == '_':
                filename = filename[1:]
        # Fix duplicate filenames
        if 'paprika' in pageUrl and '69-2' in pageUrl:
            filename = filename.replace('69', '69-2')
        elif 'rascals' in pageUrl and '89-2' in pageUrl:
            filename = filename.replace('89', '90')
        elif 'rascals' in pageUrl and '133-2' in pageUrl:
            filename = filename.replace('133', '134')
        elif 'caughtinorbit' in pageUrl and '26gs' in filename:
            filename = filename.replace('026gs', '021')
        elif 'caughtinorbit' in pageUrl and '27gs' in filename:
            filename = filename.replace('027gs', '022')
        # Fix unordered filenames
        if 'addictivescience' in pageUrl:
            page = self.getPage(pageUrl)
            num = int(self.match(page, '//div[@id="comic-wrap"]/@class')[0].replace('comic-id-', ''))
            filename = '%04d_%s' % (num, filename)
        elif 'CaughtInOrbit' in filename:
            filename = filename.replace('CaughtInOrbit', 'CIO')
        return filename

    @classmethod
    def getmodules(cls):
        return (
            cls('AddictiveScience', 'addictivescience', 'page0001'),
            cls('Bethellium', 'bethellium', 'c01p00'),
            cls('CaribbeanBlue', 'cb', 'page000', last='page325'),
            cls('CaughtInOrbit', 'caughtinorbit', 'comic-cover'),
            cls('IMew', 'imew', 'imew00', last='imew50'),
            cls('Knighthood', 'knighthood', 'kh0001'),
            cls('KnuckleUp', 'knuckle-up', 'page001', adult=True),
            cls('LasLindas', 'laslindas', 'll0001', adult=True),
            cls('Paprika', 'paprika', 'page000'),
            cls('PracticeMakesPerfect', 'pmp', 'title-001'),
            cls('Rascals', 'rascals', 'rascals-pg-0', adult=True),
            cls('TheEyeOfRamalach', 'theeye', 'theeye-page01'),
            cls('TinaOfTheSouth', 'tots', 'tos-01-01'),
            cls('UltraRosa', 'ultrarosa', 'pg001'),
        )
Update file headers The default encoding for source files is UTF-8 since Python 3, so we can drop all encoding headers. While we are at it, just replace them with SPDX headers. 2020-04-18 11:45:44 +00:00			`# SPDX-License-Identifier: MIT`
Unify XPath NS config over modules 2024-03-17 20:44:46 +00:00			`# SPDX-FileCopyrightText: © 2019 Tobias Gruetzmacher`
			`# SPDX-FileCopyrightText: © 2019 Daniel Ring`
Deprecate underscore-prefixed parent classes This is trying to strike a balance between updating as much existing classes as possible, but not making the diff too big... 2022-06-06 10:08:32 +00:00			`from ..scraper import ParserScraper`
Add KemonoCafe site engine 2019-09-08 02:03:01 +00:00

Deprecate underscore-prefixed parent classes This is trying to strike a balance between updating as much existing classes as possible, but not making the diff too big... 2022-06-06 10:08:32 +00:00			`class KemonoCafe(ParserScraper):`
Add KemonoCafe site engine 2019-09-08 02:03:01 +00:00			`imageSearch = '//div[@id="comic"]//img'`
			`prevSearch = '//a[contains(@class, "comic-nav-previous")]'`

			`def __init__(self, name, sub, first, last=None, adult=False):`
			`super(KemonoCafe, self).__init__('KemonoCafe/' + name)`

			`self.url = 'https://%s.kemono.cafe/' % sub`
			`self.stripUrl = self.url + 'comic/%s/'`
			`self.firstStripUrl = self.stripUrl % first`

			`if last:`
			`self.url = self.stripUrl % last`
			`self.endOfLife = True`

			`if adult:`
			`self.adult = True`

			`def namer(self, imageUrl, pageUrl):`
			`# Strip date from filenames`
			`filename = imageUrl.rsplit('/', 1)[-1]`
Clean up some minor warnings 2022-05-28 15:52:42 +00:00			`if 'ultrarosa' not in pageUrl:`
Add KemonoCafe/UltraRosa 2022-01-22 05:28:47 +00:00			`if filename[4] == '-' and filename[7] == '-':`
			`filename = filename[10:]`
			`if filename[0] == '-' or filename[0] == '_':`
			`filename = filename[1:]`
Add KemonoCafe site engine 2019-09-08 02:03:01 +00:00			`# Fix duplicate filenames`
			`if 'paprika' in pageUrl and '69-2' in pageUrl:`
			`filename = filename.replace('69', '69-2')`
			`elif 'rascals' in pageUrl and '89-2' in pageUrl:`
			`filename = filename.replace('89', '90')`
			`elif 'rascals' in pageUrl and '133-2' in pageUrl:`
			`filename = filename.replace('133', '134')`
Add KemonoCafe/CaughtInOrbit 2023-01-10 06:33:06 +00:00			`elif 'caughtinorbit' in pageUrl and '26gs' in filename:`
			`filename = filename.replace('026gs', '021')`
			`elif 'caughtinorbit' in pageUrl and '27gs' in filename:`
			`filename = filename.replace('027gs', '022')`
Move AddictiveScience to KemonoCafe 2019-09-11 02:52:08 +00:00			`# Fix unordered filenames`
			`if 'addictivescience' in pageUrl:`
			`page = self.getPage(pageUrl)`
Unify XPath NS config over modules 2024-03-17 20:44:46 +00:00			`num = int(self.match(page, '//div[@id="comic-wrap"]/@class')[0].replace('comic-id-', ''))`
Move AddictiveScience to KemonoCafe 2019-09-11 02:52:08 +00:00			`filename = '%04d_%s' % (num, filename)`
Add KemonoCafe/CaughtInOrbit 2023-01-10 06:33:06 +00:00			`elif 'CaughtInOrbit' in filename:`
			`filename = filename.replace('CaughtInOrbit', 'CIO')`
Add KemonoCafe site engine 2019-09-08 02:03:01 +00:00			`return filename`

			`@classmethod`
			`def getmodules(cls):`
			`return (`
Move AddictiveScience to KemonoCafe 2019-09-11 02:52:08 +00:00			`cls('AddictiveScience', 'addictivescience', 'page0001'),`
Add KemonoCafe/Bethellium 2021-09-26 04:07:49 +00:00			`cls('Bethellium', 'bethellium', 'c01p00'),`
Add KemonoCafe site engine 2019-09-08 02:03:01 +00:00			`cls('CaribbeanBlue', 'cb', 'page000', last='page325'),`
Add KemonoCafe/CaughtInOrbit 2023-01-10 06:33:06 +00:00			`cls('CaughtInOrbit', 'caughtinorbit', 'comic-cover'),`
Add KemonoCafe site engine 2019-09-08 02:03:01 +00:00			`cls('IMew', 'imew', 'imew00', last='imew50'),`
			`cls('Knighthood', 'knighthood', 'kh0001'),`
Add KemonoCafe/KnuckleUp 2020-10-20 07:49:35 +00:00			`cls('KnuckleUp', 'knuckle-up', 'page001', adult=True),`
Add KemonoCafe site engine 2019-09-08 02:03:01 +00:00			`cls('LasLindas', 'laslindas', 'll0001', adult=True),`
			`cls('Paprika', 'paprika', 'page000'),`
			`cls('PracticeMakesPerfect', 'pmp', 'title-001'),`
			`cls('Rascals', 'rascals', 'rascals-pg-0', adult=True),`
			`cls('TheEyeOfRamalach', 'theeye', 'theeye-page01'),`
			`cls('TinaOfTheSouth', 'tots', 'tos-01-01'),`
Add KemonoCafe/UltraRosa 2022-01-22 05:28:47 +00:00			`cls('UltraRosa', 'ultrarosa', 'pg001'),`
Add KemonoCafe site engine 2019-09-08 02:03:01 +00:00			`)`