Stripping should be done in normaliseUrl.

2014-06-08 10:12:33 +02:00 · 2014-06-08 10:12:33 +02:00 · 687d27d534
commit 687d27d534
parent c528fd1822
2 changed files with 6 additions and 4 deletions
--- a/dosagelib/comic.py
+++ b/dosagelib/comic.py
@ -42,7 +42,7 @@ class ComicImage(object):
        """Set URL and filename."""
        self.name = name
        self.referrer = referrer
-        self.url = url.strip()
+        self.url = url
        self.dirname = dirname
        filename = getFilename(filename)
        self.filename, self.ext = os.path.splitext(filename)
--- a/dosagelib/util.py
+++ b/dosagelib/util.py
@ -270,10 +270,12 @@ def unescape(text):
 _nopathquote_chars = "-;/=,~*+()@!"
 def normaliseURL(url):
-    """Removes any leading empty segments to avoid breaking urllib2; also replaces
+    """Normalising
-    HTML entities and character references.
+    - strips and leading or trailing whitespace,
    - replaces HTML entities and character references,
    - removes any leading empty segments to avoid breaking urllib2.
    """
-    url = unicode_safe(url)
+    url = unicode_safe(url).strip()
    # XXX: brutal hack
    url = unescape(url)