Skip to main content

Automating JDownloader Downloads (German!)

Project description

FeedCrawler

FeedCrawler (ehemals RSScrawler) automatisiert bequem das Hinzufügen von Links für den JDownloader.

Release Artifacts PyPI version PyPI - Downloads Github Sponsorship Chat aufrufen unter https://gitter.im/FeedCrawler/community GitHub license GitHub issues GitHub stars GitHub forks


Docker

  • Offizielles Repo im Docker Hub: docker-feedcrawler
  • Der Betrieb als Docker-Container empfiehlt sich als Standardinstallation - vor allem für NAS-Systeme, Homeserver und sonstige Geräte die dauerhaft und möglichst wartungsfrei (headless) betrieben werden sollen. Beim (Neu-)Start des Containers wird automatisch die neueste Version heruntergeladen. Wird ein neues Image im Docker Hub bereitgestellt, sollte dennoch auf dieses aktualisiert werden!
  • Für UNRAID-Server kann das Image direkt über die Community Applications bezogen und der Container so eingerichtet werden.
  • Ein FlareSolverr muss lokal verfügbar sein um Cloudflare-Blockaden zu umgehen (optional)

Windows

  • Jedem Release wird eine selbstständig unter Windows lauffähige Version des Feedcrawlers beigefügt.
  • Hierfür müssen weder Python, noch die Zusatzpakete installiert werden.
  • Einfach die jeweilige Exe herunterladen und ausführen bzw. bei Updates die Exe ersetzen.
  • Ein FlareSolverr muss lokal verfügbar sein um Cloudflare-Blockaden zu umgehen (optional)

Manuelle Installation

Voraussetzungen

Installation

pip install feedcrawler

Hinweise zur manuellen Installation und Einrichtung finden sich im Wiki!

Bekannte Fehler

  • Werden Downloads nicht mehr automatisch gestartet, wurde vermutlich der JDownloader geupdated oder neugestartet während FeedCrawler lief (#540). Bei Neustarts und Updates des JDownloaders muss zwingend auch FeedCrawler neugestartet werden, um dieses Verhalten zu vermeiden.

  • Kommt es nach einem Update oder Neustart des Containers zu einer sqlite3.OperationalError: database is locked -Fehlermeldungen, so muss der Container gestoppt, die FeedCrawler.db beliebig (bspw. zu FeedCrawler-Temp.db) umbenannt und direkt wieder zurück zu FeedCrawler.db umbenannt werden. Hintergrund ist, dass der FeedCrawler nicht während die Datenbank verwendet wird (bspw. bei aktiver Feedsuche) gestoppt werden sollte. Der Umbenennungs-Workaround stellt sicher, dass das Betriebssystem die Datei wieder freigibt (also den Lock loslässt).

  • Fehler im Installationsprozess per pip deuten auf fehlende Compiler im System hin. Meist muss ein Zusatzpaket nachinstalliert werden (Beispielsweise die VS C++ Build Tools für Windows oder libffi per apt-get install libffi-dev für den Raspberry Pi).

Update

pip install -U feedcrawler

Starten

feedcrawler in der Konsole (Python muss im System-PATH hinterlegt sein)

Hostnamen festlegen

FeedCrawler kann zum durchsuchen beliebiger Webseiten verwendet werden. Ausschließlich der Anwender entscheidet, welche Seiten durchsucht werden sollen. Diese Entscheidung trifft der Anwender selbstständig, indem er die Feedcrawler.ini in der Kategorie [Hostnames] manuell befüllt (ab = xyz.com). Eingetragen werden dort reine Hostnamen (ohne https://).

Dabei gilt

  • Welcher Hostname aufgerufen wird entscheidet allein der Anwender.
  • Ist nicht mindestens ein Hostname gesetzt, wird der FeedCrawler nicht starten.
  • Passt die aufgerufene Seite hinter dem jeweiligen Hostnamen nicht zum Suchmuster des Feedcrawlers, kann es zu Fehlern kommen.
  • Weder FeedCrawler noch der Autor benennen oder befürworten spezifische Hostnamen. Fragen hierzu werden ignoriert!

Sicherheitshinweis

Der Webserver sollte nie ohne Absicherung im Internet freigegeben werden. Dazu lassen sich im Webinterface Nutzername und Passwort festlegen.

Es empfiehlt sich, zusätzlich einen Reverse-Proxy mit HTTPs-Zertifikat, bspw. kostenlos von letsencrypt, zu verwenden.

Startparameter

Parameter Erläuterung
--log-level=<LOGLEVEL> Legt fest, wie genau geloggt wird (CRITICAL, ERROR, WARNING, INFO, DEBUG, NOTSET)
--config="<CFGPFAD>" Legt den Ablageort für Einstellungen und Logs fest
--port=<PORT> Legt den Port des Webservers fest
--jd-user=<NUTZERNAME> Legt den Nutzernamen für My JDownloader fest
--jd-pass=<PASSWORT> Legt das Passwort für My JDownloader fest
--jd-device=<GERÄTENAME> Legt den Gerätenamen für My JDownloader fest (optional, wenn nur ein Gerät vorhanden ist)
--keep-cdc Leere die CDC-Tabelle (Feed ab hier bereits gecrawlt) nicht vor dem ersten Suchlauf

Credits

Project details


Release history Release notifications | RSS feed

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

feedcrawler-11.0.19.tar.gz (448.0 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

feedcrawler-11.0.19-py3-none-any.whl (462.5 kB view details)

Uploaded Python 3

File details

Details for the file feedcrawler-11.0.19.tar.gz.

File metadata

  • Download URL: feedcrawler-11.0.19.tar.gz
  • Upload date:
  • Size: 448.0 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.4.2 importlib_metadata/4.8.1 pkginfo/1.7.1 requests/2.22.0 requests-toolbelt/0.9.1 tqdm/4.62.3 CPython/3.8.10

File hashes

Hashes for feedcrawler-11.0.19.tar.gz
Algorithm Hash digest
SHA256 b84bf8e9282db06cb91f555b4c82e6bb17bc3a3560db1e40278d7a69162be05d
MD5 1e75164083ea042ccfb13b9b8683d900
BLAKE2b-256 8a93ab87e57c47ac627bd6aca945155f6d05fe8abbbba796a35fdb8d4b9a29b3

See more details on using hashes here.

File details

Details for the file feedcrawler-11.0.19-py3-none-any.whl.

File metadata

  • Download URL: feedcrawler-11.0.19-py3-none-any.whl
  • Upload date:
  • Size: 462.5 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.4.2 importlib_metadata/4.8.1 pkginfo/1.7.1 requests/2.22.0 requests-toolbelt/0.9.1 tqdm/4.62.3 CPython/3.8.10

File hashes

Hashes for feedcrawler-11.0.19-py3-none-any.whl
Algorithm Hash digest
SHA256 581bfe40604313e299fd56473e79111bdf73bd28be7ce6287d41dc0468544d96
MD5 1af8c60664ae47c62d7f8c9e858a37de
BLAKE2b-256 eebb88f5408fa15cc9c5e0a4f5df4f812e5d6fb5b2cf6106c5352a6abde1a533

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page