Keskustelu wikiprojektista:Suomi 100/International Challenge

Wikipediasta
Siirry navigaatioon Siirry hakuun

Osallistujien käyttäjänimet[muokkaa wikitekstiä]

Ne pitää varmaan linkittää fiwikiin, jotta botti tunnistaa ne, eli ei näin [[:fr:User:Stryn|Stryn]]? Yksi merkinnyt noin, ja toinen vielä enemmän pieleen. Stryn (keskustelu) 23. lokakuuta 2017 kello 16.44 (EEST)[vastaa]

varmistan Danmichaelolta; muistaakseni piti olla OK juuri noin. --Tappinen (keskustelu) 23. lokakuuta 2017 kello 16.50 (EEST)[vastaa]
Tää on OK. English summary: Language prefix is OK. --Tappinen (keskustelu) 24. lokakuuta 2017 kello 07.41 (EEST)[vastaa]
Varmistelin näitä vielä. Botti katsoo viimeisen kaksoispisteen ja pystyviivan välissä olevaa sanaa (ja etsii sitä kaikista osallistujawikeistä). Linkkiä koto-kotisivulle tarvitaan siihen, että kilpailun päättyessä osataan laittaa ne hirvensydämet oikeaan paikkaan (käsin), ja siihen että muut kilpailijat voi tarkistaa että kuka ja mistä. --Tappinen (keskustelu) 2. marraskuuta 2017 kello 08.03 (EET)[vastaa]
Mitä mun pitää nyt tehdä? --Joe K. (keskustelu) 2. marraskuuta 2017 kello 08.49 (EET)[vastaa]
Katsoa tälle sivulle Wikiprojekti:Suomi 100/Luettelo linkattuja artikkeleita, parantaa niitä tai niiden käännöksiä muille kielille. Mainitsemiesi kiinnostuksen kohteiden pohjalta voisin ehdottaa, että jos löydät sopivaa materiaalia aiheesta Suomen kansanvaltuuskunta, sen linkittäminen en-wikin sivulle en:Finnish People's Delegation olisi tosi hienoa. Jos et halua kirjoittaa englanniksi, voit laittaa sinne loppuun osion "External links" - sieltäkin se tulisi muunkielisten kirjoittajien käyttöön. --Tappinen (keskustelu) 2. marraskuuta 2017 kello 13.23 (EET)[vastaa]
Lähinnä tarkoitin, että mitä pitää tehdä, jotta saan varmasti kaikki minulle kuuluvat pisteet. --Joe K. (keskustelu) 2. marraskuuta 2017 kello 19.38 (EET)[vastaa]
Ilmoittautumisesi on kunnossa. Pisteitä pitäisi tulla kaikista listan artikkeleista ja kielistä. Kokeile! Botti laskee pisteet parin tunnin välein. --Tappinen (keskustelu) 2. marraskuuta 2017 kello 19.44 (EET)[vastaa]

Interesting, this system reminds me of the Indonesian contests. :) --Nemo 4. marraskuuta 2017 kello 22.15 (EET)[vastaa]

Do they also have a bot? –Danmichaelo (keskustelu) 9. marraskuuta 2017 kello 00.11 (EET)[vastaa]

Pisteiden hylkääminen[muokkaa wikitekstiä]

Olin näköjään saanut pisteitä tästä palautustyökalun käytöstä, varmaan hylkäyskriteeri toimii samalla tavoin kuin viikon kilpailussa? Stryn (keskustelu) 5. marraskuuta 2017 kello 14.00 (EET)[vastaa]

Ei välttämättä, sillä OLDID on kansallinen parametri... kysyn tästäkin Danmichaelolta. --Tappinen (keskustelu) 5. marraskuuta 2017 kello 14.14 (EET)[vastaa]
It didn't check for rollbacks, but now it does (using the text from MediaWiki:Revertpage for each wiki). You can verify by looking for "Ignoring revision" on https://tools.wmflabs.org/ukbot/fi-100/statusDanmichaelo (keskustelu) 5. marraskuuta 2017 kello 17.29 (EET)[vastaa]
I have also got some points for reverting/discarding changes to article fi:Saimaannorppa. Ipr1 (keskustelu) 9. marraskuuta 2017 kello 02.34 (EET)[vastaa]

The points for words are pointless and unfair for some languages[muokkaa wikitekstiä]

I just want to point out that points for added words are unfair for languages such as Chinese and Japanese. There is no space character between words. Basically you would count a whole paragraph as just one word. --TuhansiaVuoria (keskustelu) 5. marraskuuta 2017 kello 14.55 (EET)[vastaa]

Interesting point. I think this is the first time when the bot has been used to score languages with such a different writing system. --Tappinen (keskustelu) 5. marraskuuta 2017 kello 15.00 (EET)[vastaa]
I guess the word count measure isn't even totally fair among different alphabetic languages since some use longer and more compound words than others. But it's extreme for the logographic languages of course. One possible solution could be to calculate a word count based on the character count I guess (multiplying the character count by some factor for each language). Another could be to abandon the word count measure completely. I'm open for adjusting the bot if we can agree on how to do it. –Danmichaelo (keskustelu) 5. marraskuuta 2017 kello 17.25 (EET)[vastaa]
In my opinion we will not change rules for this competition in middle or a running contest. But, this is an interesting aspect to keep in mind when developing international contests in the future. --Tappinen (keskustelu) 5. marraskuuta 2017 kello 20.12 (EET)[vastaa]

I would opt to modify the rules for this obvious flaw. For example, User ネイ has created the page for "Kurjenrahka National Park" in Japanese with more than 4k bytes, but only 2 points are rewarded for 8 words. Obviously there are more than 8 words for the whole article. One proposal would be "0.05 points for each byte of readable text in articles. Bonus 5 points for 500 bytes". --TuhansiaVuoria (keskustelu) 5. marraskuuta 2017 kello 20.39 (EET)[vastaa]

I am not sure, but I get the impressions that writing the same content in logographic language provides more bytes than in the alphabetic languages. In general I do not have a strong opinion about this; anyways the goal of this challenge is to produce a lot of good articles, gamification is the tool, not the goal. --Tappinen (keskustelu) 5. marraskuuta 2017 kello 20.47 (EET)[vastaa]
Just to point out: size (word/byte count) does not indicate quality in any way. It is easy to add plenty of words by making unnecessarily complicated sentences. So in that regard the point system is basically very flawed. But until we have better AI that is all we CAN do.. Ipr1 (keskustelu) 5. marraskuuta 2017 kello 23.17 (EET)[vastaa]
It is true that one Chinese character needs 2 bytes. However, same content in Chinese occupies even less bytes than in the alphabetic languages. I agree that the goal is to increase the contents of Finland related articles. However, we should correct the obvious flaw in the scoring rules. Otherwise, we should just ditch the whole scoring system, and use something else instead. --TuhansiaVuoria (keskustelu) 5. marraskuuta 2017 kello 21.13 (EET)[vastaa]
I'm not sure if this is a good idea, but what we could do for these languages is to define a different way of counting words. For instance, we could define it as the number of characters divided by some factor, say 2.[1] Or perhaps 2.5 or 3 for Japanese? Testing: For this rev., I got 1450 characters from the extract. Pasting it into Google Translate generated around 500 words. So a factor on the high end, like 3, could make sense I think, esp. since it's not surprising to find articles like ja:ヴィルホ・ランピ that include quite a bit of latin text. –Danmichaelo (keskustelu) 5. marraskuuta 2017 kello 23.03 (EET)[vastaa]
Yes. I would not like to abandon the word rule altogether, only for logographic languages. A conservative estimate, say 3 or even 4, would be wise. In my understanding, the word-rule and upper limit of byte-rule are there to discourage creation of articles consisting mainly of large tables and half-empty infoboxes. If you say this is doable technically, I will write to Challence Help Desk, then we wait for 24h for protests and off we go. Right? --Tappinen (keskustelu) 5. marraskuuta 2017 kello 23.15 (EET)[vastaa]
That's correct. It removes templates, tables and many syntax elements before counting the number of words (split by whitespace). To get an idea on how this will work in practice, I prepared a test run at Käyttäjä:UKBot/Sandbox using a factor of 2 characters per word for zh and a factor of 3 for ja. It doesn't seem totally off, but it would be good to have more eyes on it before we decide to go for these factors. –Danmichaelo (keskustelu) 5. marraskuuta 2017 kello 23.36 (EET)[vastaa]
Promising. More tomorrow... --Tappinen (keskustelu) 5. marraskuuta 2017 kello 23.39 (EET)[vastaa]
It may be worth mentioning, that while many other international challenges have used the KISS rule and self-scoring (see en:Wikipedia:Translating_Ibero-America/Participants_2016) we implemented the rules which have been used in the weekly competitions in a few wikis + friendly Finland-Estonia contest. --Tappinen (keskustelu) 5. marraskuuta 2017 kello 23.39 (EET)[vastaa]

How about my previous proposal: "0.05 points for each byte of readable text in articles. Bonus 5 points for 500 bytes"? This implies that in alphabetical based languages there are 5 letters (5 bytes) for one word, and 2.5 characters (5 bytes) for one word in Chinese or Japanese, which is more or less OK. This is also fair for languages with long words, such as Finnish. --TuhansiaVuoria (keskustelu) 5. marraskuuta 2017 kello 23.49 (EET)[vastaa]

That's also an option. Then we would have to define a new rule (in Malline:Viikon kilpailu pisteet and some other places). I feel like it's a little bit more disruptive to replace the word count rule completely, even though the new rule will fulfill the same purpose, so it could probably be argued that it's no worse than changing the word count definition :/ Btw. the current "byte" counts use numbers from MediaWiki that I think are actually character counts despite the name. –Danmichaelo (keskustelu) 6. marraskuuta 2017 kello 00.41 (EET)[vastaa]
I would not change the rule for all of the wikis, as we have participants who already have years of experience of these rules in weekly competition. So I would prefer only adding a different definition of word for logographic languages. --Tappinen (keskustelu) 6. marraskuuta 2017 kello 06.41 (EET)[vastaa]

I have now opened discussion in the Helpdesk page. --Tappinen (keskustelu) 6. marraskuuta 2017 kello 07.23 (EET)[vastaa]

No protests there, go ahead. --Tappinen (keskustelu) 7. marraskuuta 2017 kello 10.51 (EET)[vastaa]
Ok, so the bot now counts one word for every 2 characters at zhwiki and one word for every 3 characters at jawiki. While this is in no way a perfect solution, it was easy to implement, doesn't create too much disruption and it makes the contest more just than it was. –Danmichaelo (keskustelu) 9. marraskuuta 2017 kello 00.09 (EET)[vastaa]

Hello. I have a question. In Russian Wikipedia, according to well-established traditions, there can not be an article "Wildlife of Finland", such information is described in the articles "Flora of Finland" and "Fauna of Finland". Such articles and I want to write. How to make it so that they poppali in the standings of the marathon? :) JukoFF (keskustelu) 8. marraskuuta 2017 kello 18.04 (EET)[vastaa]

The ru-wiki article for "Finland" has a section Flora and fauna (I was going to suggest improving it, but it is already quite extensive). Above that is red link to main article Природа Финляндии - would that be the right one (Matches the Finnish version "Suomen luonto") ? --Tappinen (keskustelu) 8. marraskuuta 2017 kello 22.23 (EET)[vastaa]
Yes. You are right, but in Russian-language Wikipedia articles like "Wild Nature in the Country" are not written. Such articles are always written with two articles "Flora in the Country" and "Fauna in the Country." It happened historically. And I wanted to solve this contradictory. JukoFF (keskustelu) 9. marraskuuta 2017 kello 12.18 (EET)[vastaa]

Bot not counting contributions in Northern Sámi Wikipedia for some reason[muokkaa wikitekstiä]

I included the Northern Sámi Wikipedia in the contest yesterday, but UKBot is not counting contributions from it for some reason, even though the scores have been updated many times after the se-wiki was included. Some help please? -Yupik (keskustelu) 29. marraskuuta 2017 kello 12.09 (EET)[vastaa]

The same with the Dutch Wikipedia that I included on monday, but I asume it will take some time before the bot includes the new wikipedias. --DirkVE (keskustelu) 29. marraskuuta 2017 kello 12.41 (EET)[vastaa]
Wouldn't be such a problem if the contest wasn't ending tomorrow :D -Yupik (keskustelu) 29. marraskuuta 2017 kello 12.56 (EET)[vastaa]
Tappinen has pinged UKBot's owner to let him know about these two wikis being added. So it should be fixed asap :) -Yupik (keskustelu) 29. marraskuuta 2017 kello 12.59 (EET)[vastaa]

Do not worry, keep editing. We can add the points afterwards. --Tappinen (keskustelu) 29. marraskuuta 2017 kello 15.15 (EET)[vastaa]

Sorry for the delay, both added now! All contributions will be included. –Danmichaelo (keskustelu) 29. marraskuuta 2017 kello 15.26 (EET)[vastaa]
Thanks for all the help! -Yupik (keskustelu) 29. marraskuuta 2017 kello 18.14 (EET)[vastaa]
It is great to have new languages in, even last minute ! A hint for inspiration: have a look at galleries in fi-wiki version of Helene Schjerfbeck. --Tappinen (keskustelu) 29. marraskuuta 2017 kello 23.01 (EET)[vastaa]
Ran into the usual problem with the Northern Sámi wikipedia: not knowing what most of the terms were in the article for Schjerfbeck, since they weren't in any dictionaries :D But I'm hoping to find them out soon and continue editing even though the contest is over. -Yupik (keskustelu) 4. joulukuuta 2017 kello 01.19 (EET)[vastaa]

The bot somehow forgot the adding of this picture. --Gereon K. (keskustelu) 30. marraskuuta 2017 kello 15.53 (EET)[vastaa]

@Tappinen: Is nobody reading this talk page? --Gereon K. (keskustelu) 8. joulukuuta 2017 kello 11.16 (EET)[vastaa]
No, nobody is reading it any more... :) I think it is related to the Filei-filename issue. We will fix the final results. Sorry. --Tappinen (keskustelu) 8. joulukuuta 2017 kello 11.20 (EET) Retry @Danmichaelo: ? --Tappinen (keskustelu) 8. joulukuuta 2017 kello 11.21 (EET)[vastaa]

Thanks to all those organizing this contest! --Hkoala (keskustelu) 2. joulukuuta 2017 kello 19.54 (EET)[vastaa]