โครงการ RStudio สำหรับผู้เริ่มต้น [2022]

เผยแพร่แล้ว: 2021-01-10

ในบทความต่อไปนี้ เรากำลังพูดถึงโปรเจ็กต์ RStudio มันคืออะไร เหตุใดคุณจึงควรใช้ และคุณจะใช้งานได้อย่างไร เราได้พูดคุยถึงแนวทางปฏิบัติที่ดีที่สุดหลายประการเกี่ยวกับโครงการ RStudio เพื่อให้คุณสามารถทำงานร่วมกับพวกเขาได้อย่างรวดเร็วและมีประสิทธิภาพ มาเริ่มกันเลย.

สารบัญ

RStudio คืออะไร?

RStudio เป็น IDE (Integrated Development Environment) สำหรับ R ซึ่งเป็นหนึ่งในภาษาการเขียนโปรแกรมที่สำคัญที่สุดในการวิเคราะห์ข้อมูล มีคอนโซล ตัวแก้ไข ตลอดจนเครื่องมือมากมายสำหรับการดีบัก การวางแผน และการจัดการพื้นที่ทำงาน มีทั้งโอเพ่นซอร์สและรุ่นเชิงพาณิชย์ในตลาด และคุณสามารถใช้กับระบบปฏิบัติการ Mac, Linux และ Windows มีเวอร์ชันออนไลน์ที่คุณสามารถเข้าถึงได้ผ่านเบราว์เซอร์ของคุณ

เป็นสภาพแวดล้อมการพัฒนาและช่วยคุณในการใช้ R สำหรับการคำนวณทางสถิติ ในการใช้ RStudio คุณควรจะคุ้นเคยกับ R ซึ่งเป็นภาษาการเขียนโปรแกรม นี่คือรายละเอียดการ สอนเกี่ยวกับ R หากคุณสนใจ

ทำไมต้องใช้โครงการ Rstudio?

มีข้อผิดพลาดทั่วไปที่นักวิเคราะห์หลายคนทำขณะทำงานกับ RStudio วิธีปกติในการตั้งค่าไดเร็กทอรีงานคือการใช้ setwd() ปัญหาของวิธีการแบบเดิมคือสร้างเส้นทางไฟล์แบบสัมบูรณ์เป็นอินพุตและตั้งค่าเหมือนกับไดเร็กทอรีการทำงาน ในการเข้าถึงการวิเคราะห์ข้อมูล คุณต้องใช้ getwd()

การมีเส้นทางของไฟล์แบบสัมบูรณ์ทำให้ไดเร็กทอรีการทำงานของคุณเสี่ยงต่อตัวแบ่งลิงก์ ลิงก์ไดเรกทอรีของคุณสามารถแตกหักได้ง่ายในวิธีนี้ ซึ่งทำให้การแชร์โครงการนี้กับผู้อื่นเป็นเรื่องยากมาก ตัวอย่างเช่น หากคุณย้ายรายการไปยังโฟลเดอร์ย่อย ลิงก์ของรายการจะพัง เราสามารถพูดได้ว่าการมีเส้นทางของไฟล์ที่แน่นอนทำให้แทบเป็นไปไม่ได้เลยที่คุณจะแบ่งปันงานของคุณกับผู้อื่น

นอกจากนี้ ในฐานะนักวิเคราะห์ข้อมูล คุณจะต้องทำงานเป็นทีมร่วมกับผู้เชี่ยวชาญคนอื่นๆ ดังนั้น คุณจะต้องแบ่งปันงานของคุณกับผู้อื่นและทำงานร่วมกัน

เรียนรู้เพิ่มเติม: บทช่วยสอน R สำหรับผู้เริ่มต้น: เป็นผู้เชี่ยวชาญในการเขียนโปรแกรม R

การแก้ไขปัญหา

แทนที่จะทำตามเส้นทางดั้งเดิมของการใช้ setwd() คุณสามารถสร้างโครงการ RStudio และขจัดปัญหาทั้งหมดได้ โครงการ Rstudio ทำให้เส้นทางของไฟล์สัมพันธ์กัน แทนที่จะเป็นแบบสัมบูรณ์ ซึ่งช่วยในการรักษาเส้นทางของไฟล์ให้ปลอดภัย เมื่อคุณสร้างโปรเจ็กต์ RStudio พวกเขาจะเพิ่มนามสกุล .Rproj ให้กับไฟล์ของคุณ

ด้วยส่วนขยายนี้ เมื่อใดก็ตามที่ RStudio ทำงานผ่านไฟล์นี้ ไดเร็กทอรีการทำงานจะชี้ไปที่โฟลเดอร์ที่บันทึกไว้ ซึ่งหมายความว่าแม้เมื่อคุณย้ายไฟล์โครงการของคุณไปยังโฟลเดอร์ย่อยหรือตำแหน่งอื่น ไฟล์จะยังคงสามารถเข้าถึงได้

คุณควรทำตามวิธีนี้เพื่อสร้างและบันทึกเซสชัน RStudio ของคุณเท่านั้น ไม่เพียงแต่จะช่วยคุณในการทำให้ไฟล์ของคุณสามารถเข้าถึงได้ แต่ยังช่วยคุณในการแบ่งปันกับผู้อื่นอีกด้วย คุณจะไม่ต้องกังวลว่าเส้นทางของไฟล์จะเสียหายเหมือนที่คุณเคยทำกับวิธีการเดิม เช่น เมื่อคุณใช้ setwd()

การหลีกเลี่ยงวิธีการแบบเดิมอาจดูน่ากลัวสำหรับคุณ แต่อย่ากังวล วิธีนี้ดีกว่าในหลาย ๆ ด้านที่เราได้กำหนดไว้ก่อนหน้านี้ เมื่อคุณรู้แล้วว่าเหตุใดคุณจึงควรใช้โปรเจ็กต์ RStudio ตอนนี้ เราควรพูดถึงวิธีใช้งาน

วิธีสร้างโครงการ RStudio

ในการสร้างโปรเจ็กต์ RStudio คุณต้องใช้ตัวเลือก "สร้างโปรเจ็กต์" ก่อน ซึ่งคุณสามารถเข้าถึงได้ผ่านแถบเครื่องมือส่วนกลางโดยเลือกเมนูโปรเจ็กต์ที่นั่น

หลังจากที่คุณเลือกตัวเลือก 'สร้างโครงการ' แล้ว RStudio จะสร้างไฟล์โครงการที่มีนามสกุล .Rproj ภายในไดเร็กทอรีการทำงาน นอกจากนี้ยังสร้างรายการที่ซ่อนอยู่ภายใต้ชื่อ .Rproj ผู้ใช้ที่เก็บไฟล์ชั่วคราวทั้งหมดที่เกี่ยวข้องกับโครงการ เช่น .gitignore จากนั้นจะโหลดโปรเจ็กต์ลงใน RStudio และแสดงชื่อในแถบเครื่องมือ

เมื่อคุณสร้างโปรเจ็กต์แล้ว คุณควรใช้เฉพาะไฟล์ที่มีอยู่ในไดเร็กทอรีนั้น เว้นแต่ว่าโปรเจ็กต์ของคุณต้องการใช้เครื่องมือบนอินเทอร์เน็ต (เรียก API หรือทำการขูดเว็บ) คุณสามารถสร้างโครงการ RStudio ภายในรายการที่มีอยู่หรือในระเบียนใหม่ มาดูวิธีการใช้โปรเจ็กต์เหล่านี้กัน:

วิธีทำงานกับโครงการ RStudio

จะเป็นการดีที่สุดหากคุณเริ่มงานเสมอโดยเปิดไฟล์ .Rproj และเปิดข้อมูลอื่นหลังจากนั้น ซึ่งเป็นแนวทางปฏิบัติที่ดีที่สุด ในการเปิดไฟล์ .Rproj คุณสามารถเปิด RStudio และใช้ตัวเลือก 'เปิดโครงการ' ที่มีอยู่ในเมนูโครงการในแถบเครื่องมือ เมื่อคุณเลือกคำสั่งนั้น คุณจะเห็นรายการโครงการที่คุณสร้างขึ้น ซึ่งคุณสามารถเลือกคำสั่งที่ต้องการใช้งานได้

RStudio สร้างเซสชัน R ใหม่เมื่อคุณเปิดโครงการ นอกจากนี้ยังโหลดไฟล์ .RData ที่มีอยู่ในไดเร็กทอรีการทำงาน (หากโครงการต้องการ) พร้อมกับไฟล์ .Rhistory ในบานหน้าต่างประวัติ RStudio ยังกู้คืนการตั้งค่าที่เกี่ยวข้องทั้งหมด (ตำแหน่งตัวแยก แท็บที่ใช้งานอยู่ ฯลฯ) ไปยังตำแหน่งที่คุณปิดโปรเจ็กต์ในเซสชันที่แล้ว อย่างที่คุณน่าจะสังเกตได้ในตอนนี้ การใช้โปรเจ็กต์ RStudio นั้นง่ายกว่าการใช้วิธีการแบบเดิม

จะเป็นการดีที่สุดหากคุณพิจารณาเปิดไฟล์ .Rproj เป็นการเริ่มต้นงานทั้งหมดของคุณ ช่วยให้มั่นใจได้ว่าไดเร็กทอรีการทำงานของคุณทำงานได้อย่างราบรื่นและมีประสิทธิภาพ นอกจากนี้ยังช่วยคุณในการหลีกเลี่ยงข้อผิดพลาดที่เกี่ยวข้องกับเวิร์กโฟลว์ของคุณ

อ่าน: 6 แนวคิดโครงการ R ที่น่าสนใจสำหรับผู้เริ่มต้น

วิธีจัดโครงสร้างไดเรกทอรีโครงการของคุณ

นอกเหนือจากการใช้โปรเจ็กต์ RStudio แล้ว ต่อไปนี้คือคำแนะนำสั้นๆ เกี่ยวกับวิธีจัดโครงสร้างไดเร็กทอรีโปรเจ็กต์ของคุณเพื่อการจัดการและการจัดการที่มีประสิทธิภาพ

ข้อมูล

ขั้นแรก คุณควรมีโฟลเดอร์ย่อย Data ที่คุณบันทึกไฟล์ทั้งหมดที่คุณต้องอ่านลงใน R เพื่อดำเนินการสร้างภาพหรือการวิเคราะห์ที่จำเป็น กล่าวคือ โฟลเดอร์นี้ใช้สำหรับจัดเก็บไฟล์ต้นฉบับทั้งหมด

สคริปต์

ในโฟลเดอร์นี้ คุณควรเก็บสคริปต์ R ทั้งหมดและไฟล์ทั้งหมดที่มีนามสกุล .Rmd และ .R. สามารถมีโฟลเดอร์ย่อยต่อไปนี้:

  • ไฟล์

นี่คือที่ที่คุณจัดเก็บไฟล์ทั้งหมดที่มีนามสกุล .Rmd และ .R (เรียกอีกอย่างว่าไฟล์ RMarkdown)

  • ฟังก์ชั่น

นี่คือที่ที่คุณจัดเก็บฟังก์ชันที่กำหนดเองทั้งหมดที่คุณสร้างขึ้น เป็นทางเลือก

  • การวิเคราะห์

นี่คือที่ที่คุณจัดเก็บสคริปต์ R ดั้งเดิมทั้งหมดสำหรับโครงการของคุณ โฟลเดอร์นี้จะมีประโยชน์เมื่อคุณมีไฟล์การวิเคราะห์หลายไฟล์เพื่อใช้ในโครงการเดียว

เรียนรู้ หลักสูตรวิทยาศาสตร์ข้อมูล จากมหาวิทยาลัยชั้นนำของโลก รับโปรแกรม PG สำหรับผู้บริหาร โปรแกรมประกาศนียบัตรขั้นสูง หรือโปรแกรมปริญญาโท เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

เอาท์พุต

ในโฟลเดอร์นี้ คุณควรเก็บไฟล์ทั้งหมดที่คุณสร้างในโครงการของคุณ เช่น HTML พล็อต และการส่งออก โฟลเดอร์นี้มีข้อดีหลายอย่างเช่นกัน ขั้นแรก ช่วยให้ผู้อื่นทราบว่าผลลัพธ์ของโค้ดของคุณอยู่ที่ใด ประการที่สอง ช่วยในการแยกไฟล์ต้นฉบับและข้อมูลที่คุณทำงาน

อ่านเพิ่มเติม: 8 โครงการวิทยาศาสตร์ข้อมูลที่น่าอัศจรรย์ใน R สำหรับผู้เริ่มต้น

บทสรุป

เราหวังว่าคุณจะชอบคำแนะนำนี้เกี่ยวกับโครงการ RStudio หากคุณต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ R ภาษาการเขียนโปรแกรม และ RStudio เราแนะนำให้ไปที่บล็อก upGrad ซึ่งคุณจะพบแหล่งข้อมูล คู่มือ และบทความอันมีค่ามากมาย

ในทางกลับกัน หากคุณต้องการได้รับประสบการณ์การเรียนรู้ที่ละเอียดยิ่งขึ้น คุณควรเรียนหลักสูตรวิทยาศาสตร์ข้อมูล

RStudio คืออะไรและทำไมเราถึงใช้มันเพื่อสร้างโครงการ?

RStudio คือ Integrated Development Environment หรือ IDE สำหรับภาษา R เป็นหนึ่งใน IDE ที่ได้รับความนิยมมากที่สุดสำหรับ R และมีคอนโซล ตัวแก้ไข เครื่องมือสำหรับการดีบัก การพล็อต และการจัดการพื้นที่ทำงาน เหตุผลหลักประการหนึ่งของความนิยมคือมีสองรุ่นที่มีอยู่ในตลาดโอเพ่นซอร์สและเชิงพาณิชย์ ซึ่งทำให้ผู้ใช้สะดวกที่จะสร้างโครงการโดยใช้โดยไม่ต้องจ่ายเงินใดๆ ยิ่งไปกว่านั้น คุณยังสามารถใช้งานได้โดยไม่ต้องดาวน์โหลดการเริ่มต้นใช้งานโดยใช้เวอร์ชันเบราว์เซอร์ของมัน

โครงสร้างของไดเร็กทอรีโครงการของตัวเองควรเป็นอย่างไร?

นอกเหนือจากการสร้างโปรเจ็กต์แล้ว การจัดโครงสร้างไดเร็กทอรีโปรเจ็กต์ของคุณเป็นสิ่งสำคัญสำหรับการจัดการและความสามารถในการอ่านของผู้ใช้อย่างมีประสิทธิภาพ ต่อไปนี้เป็นโครงสร้างในอุดมคติที่คุณต้องเก็บไฟล์ของคุณ: โฟลเดอร์แรกควรเป็นโฟลเดอร์ Data ซึ่งจะเก็บไฟล์ต้นฉบับทั้งหมดของโครงการของคุณ ถัดไป โฟลเดอร์สคริปต์จะมีสคริปต์ R ทั้งหมดและไฟล์ที่มีนามสกุล .Rmd และ .R โฟลเดอร์นี้จะมีโฟลเดอร์ย่อยต่อไปนี้เพิ่มเติม โฟลเดอร์ไฟล์จะเก็บไฟล์ทั้งหมดที่มีนามสกุลเช่น .Rmd และ .R. ไฟล์เหล่านี้เรียกอีกอย่างว่าไฟล์ Rmarkdown โฟลเดอร์ฟังก์ชั่นเป็นทางเลือก หากคุณได้สร้างฟังก์ชันแบบกำหนดเอง คุณสามารถจัดเก็บไฟล์ไว้ในโฟลเดอร์นี้ได้ โฟลเดอร์การวิเคราะห์จะมีประโยชน์เมื่อคุณมีไฟล์การวิเคราะห์จำนวนมากที่จะใช้ในโครงการเดียว คุณสามารถจัดเก็บสคริปต์ R ดั้งเดิมในโฟลเดอร์นี้

แอปพลิเคชั่นของภาษา R คืออะไร?

R เป็นภาษายอดนิยมและใช้กันอย่างแพร่หลายในหลายโดเมน หากคุณมีพื้นฐานทางสถิติ มันอาจจะง่ายกว่า Python สำหรับคุณด้วยซ้ำ แอปพลิเคชันของภาษา R บางส่วนมีการระบุไว้ด้านล่าง: R เป็นที่นิยมอย่างมากในโดเมนการเงิน เนื่องจากมีชุดสถิติขั้นสูงเพื่อดำเนินงานด้านการเงินทั้งหมด เช่นเดียวกับการเงิน ระบบการธนาคารยังใช้ภาษา R สำหรับการวิเคราะห์ความเสี่ยง เช่น การสร้างแบบจำลองความเสี่ยงด้านเครดิต โดเมนอื่นๆ เช่น การดูแลสุขภาพและโซเชียลมีเดียยังใช้ R เพื่อวัตถุประสงค์หลายประการ