Là một ngụn ngữ đối tượng “object oriented language” Điều này cú nghĩa là cỏc dữ liệu trong được chứa trong đối tượng “object” Định hướng

Một phần của tài liệu Khai thác phần mềm r để xử lí số liệu chuỗi thời gian thông qua mô hình arima (Trang 26 - 31)

này cũng cú vài ảnh hưởng đến cỏch viết của R. Chẳng hạn như thay vỡ viết x = 5 như thụng thường chỳng ta vẫn viết, thỡ Ryờu cầu viết là x == 5.

Đối với R, x = 5 tương đương với x <- 5. Cỏch viết sau dựng kớ hiệu (<) được khuyến khớch hơn là cỏch viết trước (=). Chẳng hạn như:

> x <- rnorm(10) cú nghĩa là mụ phỏng 10 số liệu và chứa trong đối tượng

“object” x. Chỳng ta cũng cú thể viết x = rnorm(10). Một số kớ hiệu hay dựng trong R là:

x == 5 x bằng 5

x != 5 x khụng bằng 5

y < x y nhỏ hơn x

x > y x lớn hơn y

p >= 1 p lớn hơn hoặc bằng 1

is.na(x) Cú phải x là biến số trống khụng?

A & B A và B (AND)

A | B A hoặc B (OR)

! Khụng là (NOT)

Với R, tất cả cỏc cõu chữ hay lệnh sau kớ hiệu # đều khụng cú hiệu ứng, vỡ # là kớ hiệu dành cho người sử dụng thờm vào cỏc ghi chỳ.

Vớ dụ.

> # lệnh sau đõy sẽ lưu dữ liệu giỏ vàng với file=”giavangSJC” > save(giavangSJC, file=”giavangSJC.rda”)

2.1.4 Cỏch đặt tờn trong R

Đặt tờn một đối tượng “object” hay một biến số “variable” trong R khỏ linh hoạt, vỡ R khụng cú nhiều giới hạn như cỏc phần mềm khỏc. Tờn một đối tượng phải được viết liền nhau tức là khụng được cỏch rời bằng một khoảng trống. Chẳng hạn như R chấp nhận myobject, khụng chấp nhận my object.

> myobject <- rnorm(10) > my object <- rnorm(10)

Error: syntax error in "my object"

Nhưng đụi khi tờn myobject khú đọc, cho nờn chỳng ta nờn tỏch rời bằng dấu chấm “.”.

> my.object <- rnorm(10)

Một điều quan trọng cần lưu ý là R phõn biệt mẫu tự viết hoa và viết

thường.

Cho nờn My.object khỏc với my.object. Vớ dụ:

> My.object.u <- 15 > my.object.L <- 5

> My.object.u + my.object.L [1] 20

Một vài điều cần lưu ý khi đặt tờn trong R:

• Khụng nờn đặt tờn một đối tượng hay biến số bằng kớ hiệu “_” hoặc “-”

như my_object hay my-object.

• Khụng nờn đặt tờn một object giống như một biến số trong một dữ liệu. Chẳng hạn nếu chỳng ta cú một data.frame (dữ liệu hay dataset) với biến số (adsbygoogle = window.adsbygoogle || []).push({});

gia.ban trong đú, thỡ khụng nờn cú một object trựng tờn gia.ban, tức là

khụng nờn viết: gia.ban <- gia.ban.

Tuy nhiờn, nếu data.frame tờn là giavangSJC thỡ chỳng ta cú thể đề cập đến biến số gia.ban với một kớ tự $ như sau: giavangSJC$gia.ban (Tức là biến số gia.ban trong data.frame giavangSJC), và trong trường hợp đú, gia.ban <- giavangSJC$gia.ban cú thể chấp nhận được.

2.1.5 Hỗ trợ trong R

Để phõn tớch số liệu cần nhiều lệnh và nhiều hàm. Tuy nhiờn, vỡ tớnh tương tỏc cỏc lệnh này sẽ biến mất khi thoỏt khỏi R. Vấn đề đặt ra là cú cỏch nào lưu trữ cỏc lệnh này trong một hồ sơ để sau này sử dụng lại. Phần mềm cực kỡ cú ớch cho mục đớch này là Tinn-R. Website để tải Tinn-R và tài liệu hướng dẫn cỏch sử dụng là:

http://www.sciviews.org/Tinn-R

Tinn-R thực chất là một trỡnh soạn thảo “editor” cho R (và nhiều phần mềm khỏc). Tinn-R cho phộp chỳng ta lưu trữ tất cả cỏc lệnh cho một cụng trỡnh phõn tớch trong một hồ sơ. Với Tinn-R, chỳng ta cú sẵn một chỉ dẫn trực tuyến về cỏch sử dụng cỏc lệnh hay hàm trong R. Trong khi lệnh gừ sai “văn phạm” R, Tinn-R sẽ bỏo ngay và đề nghị cỏch sửa. Với Tinn-R chỳng ta ớt khi phạm phải những sai sút nhỏ trong khi chạy R. Sau khi đó xong một số lệnh, chỳng ta cú thể dựng chuột để tụ đậm những lệnh cần chạy và gửi sang R. Chỳ ý, chỳng ta khụng cần phải rời Tinn-R trong khi R chạy.

Phần mềm để “tự động húa” R cú tờn là Rcmdr (viết tắt từ R commander). Trong thực tế, Rcmdr là một package cú thể tải từ website chớnh thức của R. Chỳ ý, để Rcmdr vận hành tốt nờn cú những package sau đõy trong mỏy: relimp, multcomp, lmtest, effects, car, và abind. Nếu chưa cú những package này thỡ nờn tải chỳng về mỏy. Tài liệu chỉ dẫn Rcmdr cũng cú thể tải từ website

http://cran.R-project.org/doc/packages/Rcmdr.pdf.

Khi tải Rcmdr xuống và cài đặt vào mỏy tớnh, chỉ đơn giản lệnh:

library(Rcmdr), và một giao diện như sau sẽ xuất hiện.

Với phần “menu” (File, Edit, Data, Statistics, Graphs, Models, Distribution, Tool, Help) lỳc này vận hành của Rcmdr bằng chuột.

Tuy nhiờn phần giới thiệu về phần mềm “tự động húa” chỉ để tham khảo cũn trong nội dung chớnh của luận văn thỡ chỳng tụi chỉ quan tõm tới việc thực hành R bằng cỏc cõu lệnh.

Hỗ trợ cho R ngoài lệnh args()thỡ R cũn cung cấp lệnh help() để người sử dụng cú thể hiểu “văn phạm” của từng hàm. Chẳng hạn như muốn biết hàm arima cú những thụng số “arguments” nào, ta chỉ đơn giản lệnh:

Một cửa sổ sẽ hiện ra bờn phải của màn hỡnh chỉ rừ cỏch sử dụng ra sao và thậm chớ cú cả vớ dụ. Ta chỉ việc sao chộp “copy” và dỏn “paste” vớ dụ vào R

để xem cỏch vận hành. Trước khi sử dụng R, nếu cần chỳng ta cú thể đọc qua phần chỉ dẫn cú sẵn trong R bằng cỏch chọn mục Help và sau đú chọn Html help như hỡnh dưới đõy để biết thờm chi tiết. Bạn đọc cũng cú thể sao chộp và dỏn cỏc lệnh trong mục này vào R để xem cho biết cỏch vận hành của R.

Thay vỡ chọn mục trờn bạn đọc cũng cú thể đơn giản lệnh:

> help.start() và một cửa sổ xuất hiện chỉ dẫn toàn bộ hệ thống R.

Hàm apropos cũng rất cú ớch vỡ nú cung cấp cho chỳng ta tất cả cỏc hàm

trong R bắt đầu bằng kớ tự mà ta muốn tỡm. Chẳng hạn như chỳng ta muốn biết hàm nào trong R cú kớ tự “arima” thỡ chỉ đơn giản lệnh:

> apropos(arima)

2.1.6 Mụi trường vận hànhR

Do dữ liệu phải được chứa trong một thư mục làm việc của mỏy tớnh. Vỡ vậy trước khi sử dụng R, cú lẽ hay nhất là tạo ra một thư mục để chứa dữ liệu, chẳng hạn như D:/R thuc hanh. Chỳng ta sử dụng lệnh setwd()như sau:

>setwd(“D:/R thuc hanh”)

Lệnh trờn (setwd – chữ wd cú nghĩa là working directory) bỏo cho R biết dữ liệu sẽ chứa trong thư mục “D:/R thuc hanh”. Chỳ ý, R dựng “/” chứ khụng phải “\” như trong hệ thống Windows.

Để biết hiện nay, R đang “làm việc” ở thư mục nào, chỳng ta chỉ cần lệnh:

>getwd()

[1] "D:/R thuc hanh"

Cỏi dấu nhắc “prompt” màu đỏ mặc định của R là “>”. Nhưng nếu chỳng ta muốn cú một “prompt” khỏc theo cỏ tớnh cỏ nhõn, chỳng ta cú thể thay thế dễ dàng bằng cõu lệnh sau:

>options(prompt =”Suu>”) Suu> (adsbygoogle = window.adsbygoogle || []).push({});

Màn ảnh R mặc định là 80 kớ tự, nhưng nếu chỳng ta muốn màn ảnh rộng hơn, thỡ cần lệnh:

> options(width=100) v.v…

2.1.7 Cỏch nhập dữ liệu vào R

Muốn làm phõn tớch dữ liệu bằng R, chỳng ta phải cú sẵn dữ liệu ở dạng mà R cú thể hiểu được để xử lớ. Dữ liệu mà R hiểu được phải là dữ liệu trong

một data.frame. Cú nhiều cỏch để nhập số liệu vào một data.frame trong

Một phần của tài liệu Khai thác phần mềm r để xử lí số liệu chuỗi thời gian thông qua mô hình arima (Trang 26 - 31)