content top
FileTable ב-SQL Server 2012

FileTable ב-SQL Server 2012

הקדמה רקע קצרה: יתכן מצב בו נרצה לשלב קבצים בבסיס הנתונים (הכוונה לקבצי טקסט, Office, גרפיקה, וידאו, קול וכו'; ולא לקבצי mdf..). תסריטים אפשריים:
1. למשאבי אנוש מגיעים קבצי קורות חיים של עובדים ורוצים לשמור אותם בבסיס הנתונים (במקום לאתר את המועמד בדטבייס ולחפש במיילים או במחיצות את קובץ ה-Word שהוא שלח).
2. עבדתי פעם בחברה שייצרה מוצר צריכה נפוץ, חנויות ששמו את המוצרים של החברה במקום בולט זכו לתגמול, וסוכני המכירות היו עורכים ביקורות – מצלמים ושומרים על קשר אישי. התמונות נשמרו במחיצה עם שם שכלל את מספר הלקוח, אבל היה נוח יותר לו ניתן לשלב את הקבצים או לפחות את מיקומם בבסיס הנתונים.
3. הארגון רוצה לנהל מערכת מעקב אחר מסמכים המבוססת על SQL Server: אילו מסמכים יש, גרסאות, מאפיינים וכו'; שוב- מבלי שהקבצים יהיו קיימים באופן עצמאי ובלתי תלוי במערכת המידע.
עד גרסת 2008 ניתן היה לשמור קבצים בטבלאות בעמודות BLOB כמתואר בפוסט הזה. הפתרון מאוד בעייתי משתי סיבות עיקריות:
1. הדבר גורם לניפוח קבצי הדטבייס בקבצים ששמורים בהם כמידע בינארי, בשעה שאין למידע הזה שום שימוש כמידע לצורך פילטור או חישוב וכו' (אפשר כמובן לשמור בטבלה רק את מיקום הקובץ בדיסק אבל אז שתי המערכות אינן מסונכרנות בהכרח).
2. הטיפול בקבצים מסורבל- במקום להיכנס עם ה-File Explorer למחיצה ושם לטפל בקבצים- יש לכתוב פרוצדורה שתשמור ותשלוף אותם על פי הצורך, וליצור ממשק משתמש משל עצמנו.
מגרסת 2008 התווספה אופציית ה-FileStream: כעת יש אפשרות לשמור את הקבצים החיצוניים כך שאינם חלק מקבצי ה-mdf אלא נשמרים באופן עצמאי על הדיסק כ-FileStream, כלומר- כקובצים בינאריים שמערכת ה-SQL Server מתייחסת אליהם כאל אוסף של ביטים ובייטים מבלי להתעניין אם מדובר בקובץ PDF או Exe וכו'.
זה פותר את בעייה מספר 1 הנ"ל (ניפוח הקבצים), אך לא את מספר 2- עדיין יש לשמור ולשלוף בעזרת פקודות SQL, וזה אומר שצריך ליצור ממשק מתאים שיבצע את זה בכל פעם שנרצה לגשת לקבצים.
החל מגרסת SQL Server 2012 גם בעייה מספר 2 באה על פתרונה: כעת ניתן לטפל בקבצים דרך סייר הקבצים (File Explorer) – להכניס, למחוק, לשנות, לפתוח, לשמור, ליצור מחיצות משנה, להעביר וכו'; וכל זה מעדכן אוטומטית את הטבלה הרלוונטית. באופן דומה ניתן בעזרת פעולות DML להעתיק ולהעביר קבצים, ליצור ולמחוק מחיצות, לעדכן מאפייני קבצים (Archive, Read Only..) וכו', וכל קובץ ותת-מחיצה מתחת למחיצה שהגדרנו לטבלה קיימים סינכרונית ב-File System ובטבלה עצמה.
אם לדייק- נוכל לפגוש את הקבצים בצורה נוספת- יצירת הטבלה עם ה-FileStream יוצרת מחיצה במקום שהגדרנו שכוללת אובייקטים שונים של המערכת וקבצים בינאריים שמייצגים את הקבצים ששמרנו – ואיתם איננו אמורים להתעסק (כשם שאיננו מתעסקים ישירות עם קבצי ה-mdf אלא עם הטבלאות והפרוצדורות דרך ה-SSMS), אלא פונים למחיצה אחרת שכתובתה אינה c:\MyDir\.. כמקובל אלא משהו בסגנון של ..\MyServer\mssqlserver\MyFileTableDir\MyFileTableDirctory\\.

דיבורים, דיבורים, אבל מה עם קצת קוד?
קודם כל נקנפג את המערכת באופן חד פעמי לשימוש ב-FileStream:
דרך התפריט ה-Programs

=> Microsoft SQL Server .. => Configuration Tools => פותחים את ה-SQL Server Configuration Manager.

בצד שמאל של הכלי שנפתח בוחרים ב-SQL Server Services, ובצד ימין – קליק ימני על ה-Service הראשי של ה-Instance הרלוונטי (בדרך כלל – SQL Server (MSSQLSERVER)).
בחלונית שנפתחת ניגשים ללשונית FileStream, מסמנים את ה-CheckBoxes הרלוונטיים, מאשרים וסוגרים.

clip_image002

ב-SSMS יש לאפשר את השימוש בכלי כך:

Exec SP_Configure Filestream_Access_Level, 2;

Reconfigure;

Go

clip_image004

נעבור לדטבייס שנועד לבדיקות ונסיונות או ניצור אחד כזה על ידי פקודת Create Database MyDB (לא ניתן להשתמש ב-tempdb), ומכיוון שה-FileStream יוצר קבצים חדשים שהם חלק מהדטבייס – יש להגדיר FileGroup מתאים עבורם, מחיצה פיזית, ושם לוגי בו נפנה אליה:

Alter Database MyDB

      Add FileGroup MyFileTableFG Contains FileStream;

Go


Alter Database MyDB

      Add File(Name='MyFileTableDirName',

      FileName='C:\MyFileTableFile')

      To FileGroup MyFileTableFG;

Go


Alter Database MyDB

      Set FileStream(Non_Transacted_Access=Full,

      Directory_Name='MyFileTableDir');

Go

ולבסוף ניצור טבלה שתהיה מסונכרנת עם המחיצה הנ"ל (המחיצה הפיזית C:\MyFileTableFile המיוצגת לוגית על ידי MyFileTableDir):

Use MyDB;

Go


Create Table MyTable As FileTable

       With(FileTable_Directory='MyFileTableDirectory');

Go


Select * From MyTable Order By name;

Go

clip_image006

כעת עוד אין כלום במחיצה ולכן הטבלה ריקה, אבל כבר אפשר לשים לב שב-SSMS תחת מחיצת Tables מופיעה מחיצה חדשה בשם FileTables ובה הטבלה שנוצרה על פי הפקודה הנ"ל למרות שלא ציינו את שמות העמודות (המבנה שלה קשיח- ולא ניתן לשנותו).

בתור התחלה נוסיף פנימה כמה קבצים.

נפתח את המחיצה הלוגית כך: קליק ימני על הטבלה, ובתפריט שנפתח לבחור ב-Explore File Table Directory, ונקבל את ה-File Explorer המוכר במחיצה

\\Gerireshef\mssqlserver\MyFileTableDir\MyFileTableDirectory

(המחשב שלי נקרא GeriReshef, ולכל אחד יופיע שם המחשב וה-Instance שלו).

ומי שמתעצל לחפש קבצים מתאימים אצלו במחשב יכול להוריד את הקובץ המכווץ הזה,

לפתוח אותו במחיצה שנפתחה,

ליצור בתוכה מחיצת משנה בשם Gibuy,

להעביר לשם את קובץ ה-Rar(כדאי כבר להתרגל לרפרש את התצוגה לאחר כל פעולה על ידי F5),

clip_image008

ואפשר כך (למרות שלא ניתן "להיכנס" למחיצה על ידי פקודת CD):

clip_image009

וגם כך:

Exec XP_CmdShell 'Dir \\Gerireshef\mssqlserver\MyFileTableDir\MyFileTableDirectory';

Go

clip_image010

ולבדוק שוב את הטבלה:

Select * From MyTable Order By name;

Go

clip_image012

כבר אפשר לשים לב שהטבלה כוללת יחסי אב-בן (או- יחס של אחת לרבים 1:N עם עצמה), מה שמבטיח פוסט עתידי עם קוד רקורסיבי המאפשר לחקור את מבנה עץ מחיצות המשנה שמתחת למחיצה הלוגית.

סוג הנתון של העמודות האלו (path_locator, parent_path_locator) הוא Hierarchy_id וגם בזה עוד נלכלך את הידיים..

ננסה לבצע כמה פעולות עריכה באמצעות קוד, למשל אשכפל את עצמי (כלומר- את התמונה שלי):

INSERT

INTO   MyTable(file_stream,name)

Select 

       'MyJPG2.jpeg';

clip_image013

קצת ארוך- זה ה-FileStream של התמונה שלי כפי שהעתקתי מעמודה file_stream מהטבלה, ולאחר ריפרוש F5 נראה את הקובץ במחיצה. אפשר לחסוך את זה על ידי Select מפולטר מהטבלה, אבל רציתי להמחיש שמעתה ניתן להעביר קבצים גם כך..

כעת ניצור מחיצה חדשה:

Insert

Into   MyTable(name,is_directory)

Select 'MySubDir',

       1;

clip_image014

clip_image016

ונעביר אליה את הקובץ החדש שיצרנו על ידי Update למיקומו:

Update MyTable

Set    path_locator=(Select path_locator.ToString() From MyTable Where name='MySubDir')+Stuff(path_locator.ToString(),1,1,'')

Where  name='MyJPG2.jpeg';

clip_image018

clip_image020

כאן צריך להתחיל לתרגל את ההיכרות עם ה-HierarchyID והפונקציות שלו (נדמה לי שאנשי הדוט-נט קוראים לזה מתודות..)- ToString או Cast As Varchar מציגה את הערכים כשרשור של העץ מהשורש עד אליהם:

Select  name,

        path_locator.ToString() [path_locator],

        Cast(parent_path_locator As Varchar(Max)) [parent_path_locator]

From    MyTable;

clip_image022

השתמשתי פעם ב-ToString ופעם ב-Cast As Varchar לצורך ההמחשה.

אפשר לראות שה-path_locator של שני הקבצים במחיצות המשנה מורכב מזה של המחיצה ומזה שלו; וכך העברנו את הקובץ מהמחיצה הראשית למשנית על ידי בניית ה-path_locator שלו.

מחיקה של קובץ תתבצע על ידי פקודת Delete, אך מחיקת מחיצה יכולה להתבצע בפעולת Delete רק אם אין לה תוכן, אחרת- יש לבצע קודם Delete לתוכן (אנחנו "מריחים" רקורסיה במקרה שרוצים למחוק ענף שלם מהעץ).

אנחנו ננסה למחוק בדרך מתחכמת- מכיוון שמדובר בטבלה היא אמורה לאפשר טרנזקציות. למשל-

Begin Tran

Delete From MyTable Where name='MyJPG.jpeg';

--RollBack;

(לא לבצע RollBack בשלב זה אלא רק בסוף)

ב-Query חדש שנפתח ננסה להריץ

Select * From MyTable;

Go

והשאילתה תתקע בגלל נעילה על הטבלה.

נריץ עם Hint של NoLock

Select * From MyTable (NoLock);

Go

ולא נראה את הקובץ בטבלה.

ניגש למחיצה הלוגית ב-File Explorer, נרפרש, והוא איננו. כלומר- הכלי מציג מידע UnCommited. ראו הוזהרתם!

הסקרנים מוזמנים לחטט מעט בקרביים של המערכת ולהיכנס למחיצה הפיזית C:\MyFileTableFile שיצרנו, לחטט בתתי המחיצות ולחפש היכן שמורים הקבצים ובאיזה אופן (בכניסה יש לקבל אישור חד פעמי מכיוון שמדובר במחיצת מערכת).

במקרה זה נמצא שני קבצי File Stream בגודל 5kb של שני קבצי ה-Jpeg. הווה אומר- הקובץ עדיין קיים..

לסיום- לא לשכוח לבצע Rollback.

גיבוי- בדקתי והגיבוי מתבצע גם על הקבצים. חשוב לשים לב לכך- מצד אחד יתרון בכך שתפסנו שתי ציפורים ביד אחת ולא צריך לסמוך על החבר'ה מה-System, אבל מצד שני קבצי הגיבוי עלולים להתנפח וכבר עדיף להפיל את התיק חזרה על ה-System..

לסיכום: מעניין, סוגר את הפינה של ממשק המשתמש שנותרה פתוחה עד כה, ויש עוד הרבה מה לבדוק ובעיקר לנסות- חמישה קבצים צנועים בגודלם אינם מערכת אמיתית של אלפי קבצים גדולים בעץ מסועף של מחיצות וריבוי משתמשים.

אני מקווה עוד לחזור ולהתמודד עם בעיות הרקורסיה שהכלי מציב בפנינו.


2 תגובות על “FileTable ב-SQL Server 2012”

  1. מאת יובל:

    מה לגבי נעילות?
    אם יש אפליקציה שנועלת את הקובץ התמונה לקריאה. האם תקבל נעילה ברמת השורה? אין פה מצב שמשהו חיצוני מתערב במנוע בסיס הנתונים?

  2. מאת גרי רשף:

    לא בדקתי את כל האופציות, ומה שכן בדקתי היה מפני שגם התגובה שלי לאחר שצפיתי לראשונה ביכולות של הכלי הייתה "רגע, מה יקרה אם..".

    למשל- לא כתבתי בפוסט אבל ניסיתי לראות אם הפרופיילר לוכד את פקודות המחיקה או ההעתקה של הקבצים (שאמורות להתבטא כפעולות DML בטבלה). כנראה שלא, אבל לא בדקתי לעומק..

    בקיצור- או שיהיה פוסט המשך בו אנסה לבדוק עוד כל מיני פינות, או שאתה תבדוק ותספר לנו.. :-)

כתיבת תגובה

האימייל לא יוצג באתר. (*) שדות חובה מסומנים

twelve − three =