this post was submitted on 10 Jul 2023
5 points (100.0% liked)

Haupteingang

3692 readers
2 users here now

Die Standard-Community von feddit.de

In dieser Community geht es ausschließlich um alles rund um die Instanz!

Hast du Fragen? !fragfeddit@feddit.de

matrix chat: !feddit:tilde.fun

founded 3 years ago
MODERATORS
 

Reddit hat seine API geschlossen um das Aufbauen von Datenbanken für Sprachmodelle zu verhindern. Da stellt sich die Frage: wie steht das Fediverse und insbesondere Lemmy dazu? Dürfte ich für einen freien Assistenten (z.B. für https://open-assistant.io/) Datensätze auf Basis der subs hier auf Lemmy zusammenstellen?

top 7 comments
sorted by: hot top controversial new old
[–] nottheengineer@feddit.de 3 points 1 year ago (1 children)

Es ist ein öffentliches Forum, daher kein Problem. Reddit glaubt, die Nutzerdaten zu besitzen und dafür Geld verlangen zu dürfen. Hier glaubt das niemand, die Daten werden frei zwischen Instanzen verteilt.

Bei großen Datenmengen würde ich aber mit den Admins in Kontakt treten, sonst kann durch scraping schon mal die ganze Instanz in die Knie gehen.

[–] GlowingLantern@feddit.de 4 points 1 year ago* (last edited 1 year ago) (1 children)

Obwohl, meistens wenn nichts weiteres angegeben ist, behält der Urheber alle Rechte. Steht irgendwo in den AGBs, dass alles ins Public Domain übertragen wird? Gibt es solche AGBs überhaupt? Das wäre vor allem bei längeren Posts oder Aufsätzen interessant.

[–] aard@feddit.de 2 points 1 year ago (1 children)

Public Domain existiert in Deutschland nicht.

Die meisten Beitraege hier duerften aber die Schoepfungshoehe die fuer urheberrechtlichen Schutz noetig ist nicht erreichen.

[–] gigachad@feddit.de 9 points 1 year ago

Ich weiß zwar wies gemeint ist aber irgendwie fühle ich mich trotzdem angegriffen

[–] treasure@feddit.de 3 points 1 year ago

Es ist schwierig, das zu unterdrücken. Du kannst schließlich jederzeit deine eigene Lemmy-Instanz aufsetzen und von allen anderen Instanzen, die Föderation angeschaltet haben und dich nicht explizit deföderiert haben, die Daten sammeln. Dazu musst du nicht mal scrapen.

[–] kat@feddit.de 1 points 1 year ago (1 children)

Ich glaube technisch kann man es eh nicht verhindern und illegal wäre es meines Wissens auch nicht. Aber vielleicht zielt Deine Frage auch eher auf ethische Aspekte ab? Da finde ich es schon etwas schwierig, weil die Leute, deren Posts dann benutzt würden, ja nicht wirklich um Erlaubnis gefragt wurden. Auf der anderen Seite machen Suchmaschinen auch nichts anderes (und würden sonst gar nicht funktionieren). Schwieriges Thema.

Es wäre praktisch wenn man in seinem Account ein Optin-Flag oder sowas setzen könnte, dass dann ebenfalls über die API auslesbar wäre.

[–] stergro@feddit.de 0 points 1 year ago* (last edited 1 year ago)

Ja es geht eher um die ethischen Aspekte. Gerade als Open Source Projekt ist die Meinung von anderen ja sehr wichtig für den eigenen Erfolg. Open Assistant hat import-Scripte für eine ganze Reihe von frei zugänglichen Quellen. Aber wenn eine Website es nicht will, wird eher nicht gescrapt, selbst wenn es rechtlich möglich wäre.

load more comments
view more: next ›