Add site engine for NamirDeiter comics and migrate existing comics

2019-07-11 23:31:22 -07:00 · 2019-07-11 23:31:22 -07:00 · 0fed6c2c36
commit 0fed6c2c36
parent 4795613343
6 changed files with 64 additions and 52 deletions
--- a/dosagelib/plugins/a.py
+++ b/dosagelib/plugins/a.py
@ -347,15 +347,6 @@ class Annyseed(_ParserScraper):
        return tourl
 class ApartmentForTwo(_ParserScraper):
    url = 'https://apartmentfor2.com/'
    stripUrl = url + 'comics/index.php?date=%s'
    firstStripUrl = url + 'comics/'
    imageSearch = '//a/img[contains(@src, "comics/")]'
    prevSearch = '//a[./img[contains(@src, "previous")]]'
    help = 'Index format: yyyymmdd'
 class AntiheroForHire(_ParserScraper):
    stripUrl = 'https://www.giantrobot.club/antihero-for-hire/%s'
    firstStripUrl = stripUrl % '2016/6/8/entrance-vigil'
--- a/dosagelib/plugins/n.py
+++ b/dosagelib/plugins/n.py
@ -19,17 +19,6 @@ class Namesake(_ComicControlScraper):
    firstStripUrl = stripUrl % 'the-journey-begins'
 class NamirDeiter(_ParserScraper):
    baseUrl = 'https://www.namirdeiter.com/comics/'
    stripUrl = baseUrl + 'index.php?date=%s'
    url = stripUrl % '20150410'
    firstStripUrl = baseUrl
    imageSearch = '//a/img'
    prevSearch = '//a[text()="Previous"]'
    endOfLife = True
    help = 'Index format: yyyymmdd'
 class NatalieDee(_BasicScraper):
    url = 'http://www.nataliedee.com/'
    rurl = escape(url)
@ -115,15 +104,6 @@ class Nicky510(_WPNavi):
    endOfLife = True
 class NicoleAndDerek(_ParserScraper):
    url = 'https://nicoleandderek.com/'
    stripUrl = url + 'comics/index.php?date=%s'
    firstStripUrl = url + 'comics/'
    imageSearch = '//a/img[contains(@src, "comics/")]'
    prevSearch = '//a[./img[contains(@src, "previous")]]'
    help = 'Index format: yyyymmdd'
 class Nightshift(_ParserScraper):
    url = 'http://www.poecatcomix.com/comics/nightshift/'
    stripUrl = url + '%s/'
--- a/dosagelib/plugins/namirdeiter.py
+++ b/dosagelib/plugins/namirdeiter.py
@ -0,0 +1,60 @@
 # -*- coding: utf-8 -*-
 # Copyright (C) 2019-2020 Tobias Gruetzmacher
 from __future__ import absolute_import, division, print_function
 from .common import _ParserScraper
 class NamirDeiter(_ParserScraper):
    imageSearch = '//img[contains(@src, "comics/")]'
    prevSearch = ('//a[@rel="prev"]',
                  '//a[./img[contains(@src, "previous")]]',
                  '//a[contains(text(), "Previous")]')
    def __init__(self, name, baseUrl, first=None, last=None):
        if name == 'NamirDeiter':
            super(NamirDeiter, self).__init__(name)
        else:
            super(NamirDeiter, self).__init__('NamirDeiter/' + name)
        self.url = 'https://' + baseUrl + '/'
        self.stripUrl = self.url + 'comics/index.php?date=%s'
        if first:
            self.firstStripUrl = self.stripUrl % first
        else:
            self.firstStripUrl = self.url + 'comics/'
        if last:
            self.url = self.stripUrl % last
            self.endOfLife = True
    def link_modifier(self, fromurl, tourl):
        # Links are often absolute and keep jumping between http and https
        return tourl.replace('http:', 'https:').replace('/www.', '/')
    @classmethod
    def getmodules(cls):
        return (
            cls('ApartmentForTwo', 'apartmentfor2.com'),
            cls('NamirDeiter', 'namirdeiter.com', last='20150410'),
            cls('NicoleAndDerek', 'nicoleandderek.com'),
            cls('OneHundredPercentCat', 'ndunlimited.com/100cat', last='20121001'),
            cls('SpareParts', 'sparepartscomics.com', first='20031022', last='20080331'),
            cls('TheNDU', 'thendu.com'),
            cls('WonderKittens', 'wonderkittens.com'),
            cls('YouSayItFirst', 'yousayitfirst.com', first='20040220', last='20130125')
        )
 class UnlikeMinerva(_ParserScraper):
    name = 'NamirDeiter/UnlikeMinerva'
    baseUrl = 'https://unlikeminerva.com/archive/index.php'
    stripUrl = baseUrl + '?week=%s'
    url = stripUrl % '127'
    firstStripUrl = stripUrl % '26'
    imageSearch = '//img[contains(@src, "archive/")]'
    prevSearch = '//a[./img[contains(@src, "previous")]]'
    multipleImagesPerStrip = True
    endOfLife = True
--- a/dosagelib/plugins/old.py
+++ b/dosagelib/plugins/old.py
@ -635,6 +635,7 @@ class Renamed(Scraper):
        return (
            # Renamed in 2.16
            cls('1997', '1977'),
            cls('ApartmentForTwo', 'NamirDeiter/ApartmentForTwo'),
            cls('Catena', 'CatenaManor/CatenaCafe'),
            cls('ComicFury/Alya', 'ComicFury/AlyaTheLastChildOfLight'),
            cls('ComicFury/Boatcrash', 'ComicFury/BoatcrashChronicles'),
@ -726,6 +727,7 @@ class Renamed(Scraper):
            cls('KeenSpot/Newshounds', 'Newshounds'),
            cls('KeenSpot/SinFest', 'SinFest'),
            cls('KeenSpot/TheGodChild', 'GodChild'),
            cls('NicoleAndDerek', 'NamirDeiter/NicoleAndDerek'),
            cls('OnTheFasttrack', 'ComicsKingdom/OnTheFastrack'),
            cls('PetiteSymphony/Djandora', 'ComicsBreak/Djandora'),
            cls('PetiteSymphony/Generation17', 'ComicsBreak/Generation17'),
@ -739,6 +741,8 @@ class Renamed(Scraper):
            cls('SmackJeeves/RiversideExtras', 'RiversideExtras'),
            cls('SmackJeeves/StarTrip', 'StarTrip'),
            cls('TracyAndTristan', 'ComicFury/TracyAndTristan'),
            cls('UnlikeMinerva', 'NamirDeiter/UnlikeMinerva'),
            cls('Wulffmorgenthaler', 'WuMo'),
            cls('YouSayItFirst', 'NamirDeiter/YouSayItFirst'),
            cls('ZebraGirl', 'ComicFury/ZebraGirl'),
        )
--- a/dosagelib/plugins/u.py
+++ b/dosagelib/plugins/u.py
@ -42,18 +42,6 @@ class UnicornJelly(_BasicScraper):
    help = 'Index format: nnn'
 class UnlikeMinerva(_ParserScraper):
    baseUrl = 'https://unlikeminerva.com/archive/index.php'
    stripUrl = baseUrl + '?week=%s'
    url = stripUrl % '127'
    firstStripUrl = stripUrl % '26'
    imageSearch = '//img[contains(@src, "archive/")]'
    prevSearch = '//a[./img[contains(@src, "previous")]]'
    multipleImagesPerStrip = True
    endOfLife = True
    help = 'Index format: number'
 class Unsounded(_ParserScraper):
    url = 'http://www.casualvillain.com/Unsounded/'
    startUrl = url + 'comic+index/'
--- a/dosagelib/plugins/y.py
+++ b/dosagelib/plugins/y.py
@ -5,19 +5,8 @@
 from __future__ import absolute_import, division, print_function
 from ..scraper import _ParserScraper
 from .common import _WordPressScraper
 class YAFGC(_WordPressScraper):
    url = 'http://yafgc.net/'
 class YouSayItFirst(_ParserScraper):
    stripUrl = 'https://www.yousayitfirst.com/comics/index.php?date=%s'
    url = stripUrl % '20130125'
    firstStripUrl = stripUrl % '20040220'
    imageSearch = '//a/img'
    prevSearch = '//a[text()="Previous"]'
    endOfLife = True
    help = 'Index format: yyyymmdd'