ผู้ใช้:Octahedron80

มอดูลกำลังปรับปรุงอยู่ ถ้าคุณเห็น error จำนวนมาก ไม่ต้องตกใจ

th-N	ผู้ใช้คนนี้ใช้ภาษาไทยเป็นภาษาแม่

en-3	This user has advanced knowledge of English.

zh-1	这位用户的中文达到初级水平。

cmn-1	This user has basic knowledge of Mandarin Chinese.

ja-1	この利用者は初級の日本語ができます。

{{t}}-3

ผู้ใช้นี้สามารถเขียนแม่แบบวิกิได้ในระดับสูง สามารถเขียนโค้ดที่ซับซ้อนได้

JS-3

ผู้ใช้นี้สามารถเขียนจาวาสคริปต์ได้ในระดับสูง สามารถเขียนโค้ดที่ซับซ้อนได้

lua-3	Cet utilisateur dispose de connaissances avancées en ciluba.

Python-2

ผู้ใช้นี้สามารถเขียนภาษาไพทอนได้ในระดับปานกลาง สามารถเข้าใจโค้ดที่คนอื่นเขียนได้

UTC+7

ผู้ใช้นี้อยู่ในเขตเวลา UTC+7

🏠 วิกิพจนานุกรมภาษาไทย มากยิ่งกว่า วิกิพีเดียภาษาไทย
🇹🇭󠁔󠁈 ประเทศไทย
🎓 วท.บ. (ศาสตร์คอมพิวเตอร์) และ บธ.บ. (การตลาด)
🤖 ผู้ใช้:OctraBot (ปัจจุบันใช้ PAWS)
😅 ขออภัยหากข้าพเจ้าแก้ไขหน้าใดหน้าหนึ่งมากครั้งเกินไป

หน้าย่อย

อื่น ๆ สำหรับทดสอบ

สถานะโครงการ

มีมาตรฐานรูปแบบการเขียนแล้ว แต่บางครั้งต้องสร้างแม่แบบของภาษาต่าง ๆ ขึ้นมาเฉพาะ เพราะไวยากรณ์ต่างกัน รูปแบบการเขียนของคำเก่า ๆ ต้องทยอยปรับปรุงไปเรื่อย ๆ
หน้าที่ต้องการเก็บกวาดให้เป็นมาตรฐานมีจำนวนมาก เพราะคนเก่า ๆ สร้างไว้นานแล้ว
ลิงก์เชื่อมโยงระหว่าง WT ภาษาอื่น ในหน้าคำศัพท์ ไม่จำเป็นต้องมีอีกต่อไป เพราะส่วนขยาย Cognate เชื่อมโยงกันโดยอัตโนมัติ
- บางหน้ายังจำเป็น เช่น ภาษามือ คำยาวมาก หรือคำที่มีตัวอักษรที่ใช้ตั้งชื่อไม่ได้
เนมสเปซอื่นนอกเหนือจากคำศัพท์ เช่น วิกิพจนานุกรม หมวดหมู่ เชื่อมโยงถึงกันได้จากวิกิสนเทศ บางชื่อมีรูปแบบที่ชัดเจนสามารถใช้บอตได้ นอกนั้นต้องเพิ่มด้วยมือ
เนื่องจากเราใช้มอดูลลูอาตามแบบวิกิพจนานุกรมภาษาอังกฤษ ในเวลานี้เริ่มซับซ้อนมากขึ้น การอัปเดตมอดูลหนึ่งอาจกระทบมอดูลอื่น ทำให้เกิดข้อผิดพลาดเป็นลูกโซ่ ต้องพยายามทำให้บ่อยขึ้น เดี๋ยวจะตามไม่ทัน
มีการก่อกวนประปราย จากผู้ใช้ลงทะเบียนและไม่ลงทะเบียน คนที่ก่อกวนก็เป็นคนเดิม ๆ บางทีก็ลามมาจากวิกิพีเดีย
- การบล็อก IPv4 เป็นรายไอพีด้วยระยะเวลายาวนานไม่ได้ผล เพราะ IPv4 ได้แจกไปจนหมดโลกนานแล้ว ISP ต่าง ๆ ต้องเวียนเอาไอพีที่ว่างอยู่มาใช้ ซึ่งเปลี่ยนบ่อยแทบทุกชั่วโมง และคนที่ก่อกวนก็จะได้ไอพีใหม่ทุกชั่วโมง และหนึ่งไอพีก็เชื่อมโยงแบบระดับชั้นไปหลายบ้านด้วย (มือถือก็เหมือนกัน) ทำให้คนที่ไม่ได้ก่อกวนหรือมีเจตนาดีถูกบล็อกไปด้วย การบล็อก IPv4 ที่มีประสิทธิภาพจึงทำได้เพียง 1 ชั่วโมง อย่างมากก็ 1 วัน (เน็ตบ้านอัตราเดิม)
- สามารถบล็อก IPv4 range ได้ เพราะคนก่อกวนมักจะใช้เครือข่ายเดิม ไอพีขึ้นต้นก็จะเป็นเลขเดิม แต่ก็ไม่ควรบล็อกนาน (ที่คิดไว้คือ 1 เดือนแล้วค่อยต่อใหม่หากมีการก่อกวนอีก) เพราะคนที่ได้รับผลกระทบมีมาก และต้องเปิดทางให้สร้างบัญชีได้
- การบล็อก IPv6 เป็นรายไอพีด้วยระยะเวลายาวนานสามารถทำได้ เพราะไม่มีการใช้ซ้ำ ยังมีไอพีเหลือเฟือ และแทบจะไม่เปลี่ยน

ช่วยกันหน่อย

วิกิพจนานุกรม:คำศัพท์ที่ต้องการ
ผู้ใช้:Octahedron80/คำพิเศษ — คำที่สะกดด้วยตัวอักษรพิเศษ
ผู้ใช้:Octahedron80/en diff — คำที่โครงการไทยยังไม่มีเมื่อเทียบกับอังกฤษ
ช่วยเก็บกวาดการนิยามคำไทยรูปแบบเก่าให้เหมือนกันเป็นเอกภาพ

คำแนะนำ

จำนวนคำในภาษาหนึ่งมีเป็นแสน ๆ ถ้าเขียนวันละคำชาตินี้ก็ไม่เสร็จ ดังนั้นควรเขียนวันละไม่ต่ำกว่า 100 คำ
คำสั้นมักจะมีหลายภาษารวมกันอยู่มาก ทำให้ขี้เกียจแปลและจัดเรียง ถ้าเริ่มต้นสร้างคำยาวก่อน มีภาษาน้อย อาจจะทำได้เร็วกว่า
- ใช้สคริปต์แมว ๆ ช่วยเก็บกวาดเนื้อหาที่ลอกมาจาก WT ภาษาอังกฤษ ประหยัดเวลาในการเขียนเอง
ข้อความแจ้งเตือนข้อผิดพลาด และเอกสารกำกับ ของแม่แบบและมอดูล ไม่ต้องแปลก็ได้
หมวดหมู่ที่ต้องการ บางหมวดหมู่มีไว้เพื่อติดตามงานเท่านั้น ไม่จำเป็นต้องสร้างขึ้นมา
ส่วนหนึ่งของชื่อภาษา
- Proto-... = ...ดั้งเดิม ส่วนชื่อข้างหน้าทับศัพท์มาเลย
- ชื่อกลุ่มภาษาทับศัพท์มาเช่นกัน
- Middle = กลาง; Central = ตอนกลาง (ยกเว้น Mandarin = จีนกลาง; Middle Chinese = จีนยุคกลาง)
- Old = เก่า; Ancient = โบราณ (เท่าที่เห็นมี Ancient Greek = กรีกโบราณ เท่านั้น ภาษาอื่นใช้เป็นชื่อพ้อง)
- dialect/minor language ที่ขยายชื่อภาษา ใช้คำว่า "แบบ" เหมือนกันหมด เพราะบางครั้งไม่ได้อ้างถึงประเทศหรือเมือง
- early = ช่วงต้น; late = ช่วงปลาย
ชนิดของคำที่อาจสร้างความสับสน
- acronym = อักษรอ่านย่อ (คำที่เอาอักษรตัวหน้ามาและอ่านรวมกัน เช่น UNESCO, OPEC, NASA ฯลฯ; ใช้แทนศัพท์บัญญัติว่า รัสพจน์ ซึ่งคนทั่วไปไม่รู้จัก)
- initialism = อักษรย่อ (คำที่เอาอักษรตัวหน้ามาแต่ไม่อ่านรวม; ภาษาไทยส่วนมากเป็นอันนี้)
- clipping = คำตัดทอน (คำยาวที่ถูกตัดเป็นคำสั้นลง)
- contraction = คำหดย่อ (คำที่หดย่อจากหลายคำเหลือคำเดียว เช่น isn't l'more je t'aime)
- abbreviation = คำย่อ (คำที่ไม่ใช่ทั้งหมดด้านบน)
- shortening = การย่อ (หมวดหมู่ใหญ่ที่คลุมทั้งหมดด้านบน)
PSWT ก่อนหน้านี้อิงกับระบบของ Li อย่างเดียว ภายหลังพบว่า ก็ยังมีของอีกหลายคนที่เกิดขึ้นทีหลังอย่างเช่น Jonsson และต่อมา Pittayaporn ปรับปรุงระบบทั้งหมดนั่นใหม่ จึงควรเปลี่ยนไปใช้ระบบ Pittayaporn ทั้งหมด เพื่อที่จะนำไปใส่เนมสเปซ การสืบสร้าง (Reconstruction) [ยังไม่ได้โหวต] ขณะนี้ก็ยังมีระบบ Li ตกค้างอยู่หลายหน้า ส่วนวรรณยุกต์ยึดตามระบบ Gedney คือ A B C DS DL และกลุ่มพยัญชนะ 4 กลุ่มซึ่งครอบคลุมที่สุด (มีบางภาษาที่ทั้ง 4 กลุ่มผันเสียงต่างกัน จึงต้องคงไว้)
ชื่อวันและชื่อเดือน (จันทรคติหรือสุริยคติก็ตาม) บางภาษาให้เป็นคำวิสามานยนาม บางภาษาให้เป็นคำสามานยนาม
เอกโทษและโทโทษ ให้ใส่เป็นรูปแบบอื่นได้ ก็ต่อเมื่อเคยมีปรากฏในโคลงมาแล้ว

ปัญหาแปลก ๆ ด้านเทคนิค

อักขระที่มองไม่เห็น สามารถสังเกตได้จาก URL หรือการถอดเป็นอักษรไทย
- ZWSP (U+200B) หรือเครื่องหมายจัดรูปแบบอื่น ๆ ที่มองไม่เห็น มักเกิดจาก Word หรือ Machine Learning ต้องตัดออกเพราะถูกใช้เป็นตัวตัดคำ/บรรทัด ไม่มีผลในการค้นหา แต่จะทำให้เชื่อมโยงคำกันไม่เจอ และจะทำให้คนสร้างหน้าใหม่ซ้ำ
- ZWNJ (U+200C) และ ZWJ (U+200D) ควรคงไว้เพราะเกี่ยวกับการเปลี่ยนรูปอักษร (ภ.เปอร์เซีย, อูรดู, สิงหล, อีโมจิ) การใส่กับไม่ใส่ ZWNJ/ZWJ จะให้ผลลัพธ์เป็นคนละหน้า ถ้าการพิมพ์ปกติไม่ได้ใช้ ZWNJ/ZWJ ควรขจัดออกให้หมด
ตัวอักษรในภาษาไทดั้งเดิมและไทตะวันออกเฉียงใต้ดั้งเดิม ᴬ ᴮ ꟲ ᴰ ᴸ ˢ ซึ่งใช้แทนวรรณยุกต์
- มาตรฐานยูนิโคด 14.0 มี C ตัวใหญ่แล้ว คือ ꟲ (U+A7F2)
- ตัว s เป็นตัวเล็ก เพราะไม่มีตัวใหญ่ให้ใช้
คุณลักษณะ OpenType ทำงานไม่ครบถ้วนในเบราว์เซอร์
- อักษรไทธรรม เวลามีพยัญชนะมากกว่า 1 ตัว เช่นอักษรซ้อนหรือตัวควบกล้ำ (เช่น ᨣᩕ) แล้วใส่สระหน้าตาม (เช่น ᩮ) บางฟอนต์/OS สระหน้าไม่ยอมไปอยู่ข้างหน้าสุด เช่น ᨣ+ᩕ+ᩮ มันควรจะเป็น ᩮ‍ᨣᩕ ไม่ใช่ ᨣᩕ‍ᩮ
- อักษรไทลื้อใหม่ อักษรไทเวียด มาตรฐานปัจจุบันให้ใส่ตามลำดับปรากฏ (เหมือนไทย-ลาว) แต่บางฟอนต์/OS ดึงสระหน้าที่ตามหลังพยัญชนะไปไว้ข้างหน้า เช่น ᦃ‌ᦶᦈ กลายเป็น ᦶᦃᦈ แล้วก็จะได้คำที่สะกดผิดทั้งที่เราคีย์ถูก
- วิธีแก้เบื้องต้นคือใส่ ZWNJ (ระหว่างพยางค์) หรือ ZWJ (อยู่ในพยางค์) มาคั่นในศัพท์ ผ่านทางจาวาสคริปต์ มีเดียวิกิ:Gadget-legacy.js (ใช้ได้เฉพาะผู้ที่เป็นสมาชิก) เนื่องจาก DISPLAYTITLE ไม่ทำงานแล้ว ซึ่งจะเปลี่ยนเฉพาะการแสดงผลเท่านั้น การเชื่อมโยงต่าง ๆ ยังเหมือนเดิม
ภาษาถิ่นที่ใช้อักษรไทย มีพยัญชนะบางตัวที่ประพินทุ (nuqta) หรือขีดล่าง (macron) แล้วมีสระบน/ล่าง การป้อนตามตรรกะควรเป็น พยัญชนะ+พินทุ/ขีดล่าง+สระบน/ล่าง เพื่อให้ลิงก์หากันเจอ แต่หลายฟอนต์แสดงผลโดยวางพินทุ/ขีดล่างไว้ต่ำกว่าสระล่าง หรือวางทับกัน อาจทำให้สับสนได้
Combining Diacritical Marks ควรใช้ได้กับอักษรทุกแบบ เพราะเป็นกลุ่มอักษร Inherited แต่ในความเป็นจริงหลายฟอนต์ก็ไม่ได้ทำมาให้รองรับ เช่น การเติมสัญลักษณ์กำกับตัวอักษรไทย ทำให้ตัวอักษรทับซ้อนกัน หรือกลายเป็นกล่องว่าง เราต้องเข้าใจตามตรรกะว่าได้ใส่เครื่องหมายถูกต้องแล้ว
อักษรยาวีของกลุ่มภาษามาเลย์อิกทั้งหมด ให้ใช้ ک และ ݢ เท่านั้น ห้ามใช้ ك และ ڬ ของกลุ่มภาษาอาหรับ เพราะมันแสดงผลต่างกัน (ระบุไว้ในเอกสารยูนิโคด)
ฐ/ญ ไม่มีเชิง สำหรับภาษาบาลี/สันสกฤต ฟอนต์ Noto Sans Thai Looped สามารถแสดงผลให้แตกต่างกันได้ (มีฟอนต์เดียวที่ทำได้ในขณะนี้) ส่วนการตั้งชื่อหน้าให้ใช้ ฐ/ญ ปกติ
แม่แบบหลายแม่แบบ (มาก) ไม่ได้ทำมาให้รองรับโหมดมืด เช่น การใส่สีขาวไว้ในช่องตาราง ทำให้กลืนไปกับตัวหนังสือที่กลับสีเป็นสีสว่าง ซึ่งก็ต้องทยอยแก้ไปทีละแม่แบบ

บันทึก

﨎, 﨏, 﨑, 﨓, 﨔, 﨟, 﨡, 﨣, 﨤, 﨧, 﨨, 﨩
วิกิพจนานุกรม:รายชื่อภาษา
วิกิพจนานุกรม:รายชื่อกลุ่มภาษา
วิกิพจนานุกรม:รายชื่ออักษร
หมวดหมู่:หน้าที่มีข้อผิดพลาดสคริปต์ (ควรคัดลอกข้อมูลมาใหม่)
หมวดหมู่:หมวดหมู่ที่มีป้ายผิดพลาด (มอดูลทำงานถูกต้องแต่อยู่ผิดที่ผิดทาง)
หมวดหมู่:แม่แบบและมอดูลที่ต้องการเอกสารการใช้งาน
มีเดียวิกิ:Spam-blacklist — ป้องกันได้เฉพาะแอสกี ส่วนยูนิโคดไปทำใน พิเศษ:ตัวกรองการละเมิด
มีเดียวิกิ:Gadget-Palette/table