Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Delphi Новый топик    Ответить
Топик располагается на нескольких страницах: [1] 2 3   вперед  Ctrl      все
 Форматирование текста  [new]
Валерий666
Member

Откуда:
Сообщений: 79
Подскажите как решить проблеммку.
Имеется файл в 40-50-100 тысяч строк.
Строка формата
         С.    Л.    З.    C.    В. ЛС               Фамилия         Имя            Отчество          Дата        Осн. документ     Серия,       Личный номер       Дата         Дата  Дата рег. по ПрТипДатаДаДата        Адрес ЛС

Как можно заменить пробелы между словами на один знак табуляции. Чтобы в результате получить нормально отформатированный текст, который бы разбивался на колонки в Excele(к примеру).
28 сен 17, 13:00    [20828857]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
Dimitry Sibiryakov
Member

Откуда:
Сообщений: 43664

Простенький цикл, заменяющий два пробела подряд табуляцией и убирающий все последующие
пробелы. В чём проблема-то?

Posted via ActualForum NNTP Server 1.5

28 сен 17, 13:05    [20828870]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
DimaBr
Member

Откуда:
Сообщений: 10221
procedure TForm1.Button2Click(Sender: TObject);
var SL: TStringList;
    i,j: integer;
    S: string;
begin
  SL := TStringList.Create;
//  SL.LoadFromFile();
  SL.Add('         С.    Л.    З.    C.    В. ЛС               Фамилия         Имя            Отчество          Дата        Осн. документ     Серия,       Личный номер       Дата         Дата  Дата рег. по ПрТипДатаДаДата        Адрес ЛС');
  for i := 0 to SL.Count-1 do begin
    S := SL[i];
    repeat
      j := Pos('  ',S);
      if j > 0 then S := StringReplace(S,'  ',' ',[rfReplaceAll]);
    until j = 0;
    SL[j] := StringReplace(S,' ',#9,[rfReplaceAll]);
  end;
end;
28 сен 17, 13:22    [20828920]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
Валерий666
Member

Откуда:
Сообщений: 79
DimaBr,

Со строкой работает, с файлом не хочет( Что не так?

procedure TForm1.sButton1Click(Sender: TObject);
var SL: TStringList;
    i,j: integer;
    S: string;
    path:string;
begin
getdir(0,path);
  SL := TStringList.Create;
SL.LoadFromFile(path+'\1.txt');
// SL.Add(sedit1.text);
   for i := 0 to SL.Count-1 do begin
    S := SL[i];
    repeat
      j := Pos('  ',S);
      if j > 0 then S := StringReplace(S,'  ',' ',[rfReplaceAll]);
    until j = 0;
    SL[j] := StringReplace(S,' ',#9,[rfReplaceAll]);
  end;
 sl.SaveToFile(path+'\result.txt');
//sEdit2.Text:=sl.Text;
sl.Free;
end;
28 сен 17, 14:16    [20829040]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
Валерий666
Member

Откуда:
Сообщений: 79
Понял почему не работает.
28 сен 17, 14:24    [20829059]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
Няшик
Member

Откуда: Екатеринбург
Сообщений: 726
Вот вариант оптимизированный


program Project1;

{$APPTYPE CONSOLE}
{$R *.res}

uses
  System.SysUtils;

function Skip(const str: string): string;
var
  p: PChar;
  l, r: Integer;
  b: Boolean;
begin
  l := Length(str);
  SetLength(Result, l);
  r := 1;
  p := Pointer(str);
  while p^ <> #0 do
  begin
    if (p^ = ' ') and ((p + 1)^ = ' ') then
      b := true;

    Result[r] := p^;
    inc(p);
    inc(r);

    if b then
    begin
      b := False;
      while p^ = ' ' do
        inc(p);
    end;
  end;
  SetLength(Result, r - 1);
end;

var
  str: string;

begin
  try
    str := 'g 54   6767   67 rh';
    str := Skip(str);
    Writeln(str);
    Readln;
  except
    on E: Exception do
      Writeln(E.ClassName, ': ', E.Message);
  end;

end.
28 сен 17, 15:10    [20829218]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
schi
Member

Откуда: Москва
Сообщений: 2227
Няшик,

Можно поинтересоваться, в каком языке слово skip имеет отношение к форматированию ?
28 сен 17, 17:22    [20829771]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
Няшик
Member

Откуда: Екатеринбург
Сообщений: 726
schi
Няшик,

Можно поинтересоваться, в каком языке слово skip имеет отношение к форматированию ?


Имелось введу скипнуить лишние пробелы. Имя функции больше не на что не рассчитано. Оно очень глупое и не целесообразное.

Конечно в производство такое нельзя пихать, иначе это станет головной болью. Но это всего лишь демонстрация
28 сен 17, 19:28    [20830056]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
schi
Member

Откуда: Москва
Сообщений: 2227
Няшик
schi
Няшик,

Можно поинтересоваться, в каком языке слово skip имеет отношение к форматированию ?


Имелось введу скипнуить лишние пробелы. Имя функции больше не на что не рассчитано. Оно очень глупое и не целесообразное.

Конечно в производство такое нельзя пихать, иначе это станет головной болью. Но это всего лишь демонстрация


Такой код вообще никуда нельзя, даже для демонстрации.
Sad but true.
28 сен 17, 22:37    [20830350]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
чччД
Guest
Няшик,

ты Лошарик, а не Няшик. Надеюсь, тебе стыдно.
28 сен 17, 22:51    [20830397]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
Gator
Member

Откуда: Москва
Сообщений: 13809
чччД
,
ты Лошарик, а не Няшик. Надеюсь, тебе стыдно.


28 сен 17, 23:05    [20830424]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
Няшик
Member

Откуда: Екатеринбург
Сообщений: 726
Нет, мне не должно быть стыдно...

Это вам, раз вы не можете без длинной функции Pos

+
function Pos(const SubStr, Str: UnicodeString; Offset: Integer): Integer; overload;
var
  I, LIterCnt, L, J: Integer;
  PSubStr, PS: PChar;
  LCh: Char;
begin
  PSubStr := Pointer(SubStr);
  PS := Pointer(Str);
  if (PSubStr = nil) or (PS = nil) or (Offset < 1) then
    Exit(0);
  L := __StringLength(SubStr);
  { Calculate the number of possible iterations. }
  LIterCnt := __StringLength(Str) - Offset - L + 2;
  if (L > 0) and (LIterCnt > 0) then
  begin
    Inc(PS, Offset - 1);
    I := 0;
    LCh := PSubStr[0];
    if L = 1 then   // Special case when Substring length is 1
      repeat
        if PS[I] = LCh then
          Exit(I + Offset);
        Inc(I);
      until I = LIterCnt
    else
      repeat
        if PS[I] = LCh then
        begin
          J := 1;
          repeat
            if PS[I + J] = PSubStr[J] then
            begin
              Inc(J);
              if J = L then
                Exit(I + Offset);
            end
            else
              Break;
          until False;
        end;
        Inc(I);
      until I = LIterCnt;
  end;

  Result := 0;
end;



Без длмнной функции StringReplace

+
function StringReplace(const Source, OldPattern, NewPattern: string; Flags: TReplaceFlags): string;
var
  Str: string;
  xOldPattern: string;
  FoundPos: Integer;
  I, J: Integer;
  SourceIdx: Integer;
  DestIdx: Integer;
  LCharsToCopy: Integer;
  FindCount: Integer;
  PosArray: array of Integer;
  LenOP: Integer;
  LenNP: Integer;
  LenS: Integer;
  ArrLen: Integer;
  LPResult, LPSource, LPNewPattern: PChar;
  LReplaceAll: Boolean;
begin
  LenOP := Length(OldPattern);
  LenS := Length(Source);
  if (LenOP = 0) or (LenS = 0) then
    Exit(Source);

  if rfIgnoreCase in Flags then
  begin
    xOldPattern := AnsiUpperCase(OldPattern);
    LenOP := Length(xOldPattern);
    if SameStr(xOldPattern, AnsiLowerCase(OldPattern)) then // Special case, for example only symbols (+ - , * .....)
      Str := Source
    else
    begin
      Str := AnsiUpperCase(Source);
      LenS := Length(Str);
    end;
  end
  else
  begin
    xOldPattern := OldPattern;
    Str := Source;
  end;

  if Str.Length <> Source.Length then
  begin
    Result := '';
    I := Low(string);
    while I <= High(Source) do
    begin
      if string.Compare(Source, I - Low(string), OldPattern, 0, LenOP, True) = 0 then
      begin
        Result := Result + NewPattern;
        Inc(I, LenOP);
        if not (rfReplaceAll in Flags) then
        begin
          Result := Result + Source.Substring(I - Low(string), MaxInt);
          Break;
        end;
      end
      else
      begin
        Result := Result + Source[I];
        Inc(I);
      end;
    end;
  end
  else
  begin
    FoundPos := 1;
    FindCount := 0;
    ArrLen := 0;
    LReplaceAll := not (rfReplaceAll in Flags);
    repeat
      FoundPos := Pos(xOldPattern, Str, FoundPos);
      if FoundPos = 0 then
        Break;

      Inc(FindCount);
      if ArrLen < FindCount then
      begin
        if ArrLen = 0 then
          ArrLen := 32
        else
          ArrLen := ArrLen * 2;
        SetLength(PosArray, ArrLen);   // call SetLength less frequently makes a huge difference when replacing multiple occurrences
      end;
      PosArray[FindCount - 1] := FoundPos - 1; // Zero based array
      Inc(FoundPos, LenOP);
    until LReplaceAll;

    if FindCount > 0 then
    begin
      LenNP := Length(NewPattern);
      LPSource := Pointer(Source);           // We use a pointer cast to avoid the _UStrToPWChar call injected by the compiler
      LPNewPattern := Pointer(NewPattern);  // We use a pointer cast to avoid the _UStrToPWChar call injected by the compiler
      if LenNP = LenOP then
      begin                           // special case where Length(OldPattern) = Length(NewPattern)
        SetLength(Result, LenS);      // in this case, we can optimize it even further
        LPResult := Pointer(Result);    // We use a pointer cast to avoid the uniquestring call injected by the compiler
        Move(LPSource^, LPResult^, LenS * SizeOf(Char));
        if LenNP = 1 then
          for I := 0 to FindCount - 1 do
            LPResult[PosArray[I]] := LPNewPattern^
        else if LenNP <= 8 then
          for I := 0 to FindCount - 1 do
            for J := 0 to LenNP -1  do
              LPResult[PosArray[I] + J] := LPNewPattern[J]
        else
          for I := 0 to FindCount - 1 do
            Move(LPNewPattern^, LPResult[PosArray[I]], LenNP * SizeOf(Char));
      end
      else
      begin
        SetLength(Result, LenS + ((LenNP - LenOP) * FindCount));
        LPResult := Pointer(Result);    // We use a pointer cast to avoid the uniquestring call injected by the compiler
        SourceIdx := 0;
        DestIdx := 0;
        if LenNP = 0 then
          for I := 0 to FindCount - 1 do
          begin
            LCharsToCopy := PosArray[I] - SourceIdx;
            if LCharsToCopy > 0 then
            begin
              if LCharsToCopy = 1 then
              begin
                LPResult[DestIdx] := LPSource[SourceIdx];
                Inc(SourceIdx);
                Inc(DestIdx);
              end
              else if LCharsToCopy <= 8 then
              begin
                for J := 0 to LCharsToCopy - 1  do
                  LPResult[DestIdx + J] := LPSource[SourceIdx + J];
                Inc(SourceIdx, LCharsToCopy);
                Inc(DestIdx, LCharsToCopy);
              end
              else
              begin
                Move(LPSource[SourceIdx], LPResult[DestIdx], LCharsToCopy * SizeOf(Char));
                Inc(SourceIdx, LCharsToCopy);
                Inc(DestIdx, LCharsToCopy);
              end;
            end;
            Inc(SourceIdx, LenOP);
          end
        else if LenNP = 1 then
          for I := 0 to FindCount - 1 do
          begin
            LCharsToCopy := PosArray[I] - SourceIdx;
            if LCharsToCopy > 0 then
            begin
              if LCharsToCopy = 1 then
              begin
                LPResult[DestIdx] := LPSource[SourceIdx];
                Inc(SourceIdx);
                Inc(DestIdx);
              end
              else if LCharsToCopy <= 8 then
              begin
                for J := 0 to LCharsToCopy - 1  do
                  LPResult[DestIdx + J] := LPSource[SourceIdx + J];
                Inc(SourceIdx, LCharsToCopy);
                Inc(DestIdx, LCharsToCopy);
              end
              else
              begin
                Move(LPSource[SourceIdx], LPResult[DestIdx], LCharsToCopy * SizeOf(Char));
                Inc(SourceIdx, LCharsToCopy);
                Inc(DestIdx, LCharsToCopy);
              end;
            end;
            LPResult[DestIdx] := LPNewPattern[0];
            Inc(DestIdx);
            Inc(SourceIdx, LenOP);
          end
        else
          for I := 0 to FindCount - 1 do
          begin
            LCharsToCopy := PosArray[I] - SourceIdx;
            if LCharsToCopy > 0 then
            begin
              if LCharsToCopy = 1 then
              begin
                LPResult[DestIdx] := LPSource[SourceIdx];
                Inc(SourceIdx);
                Inc(DestIdx);
              end
              else if LCharsToCopy <= 8 then
              begin
                for J := 0 to LCharsToCopy - 1  do
                  LPResult[DestIdx + J] := LPSource[SourceIdx + J];
                Inc(SourceIdx, LCharsToCopy);
                Inc(DestIdx, LCharsToCopy);
              end
              else
              begin
                Move(LPSource[SourceIdx], LPResult[DestIdx], LCharsToCopy * SizeOf(Char));
                Inc(SourceIdx, LCharsToCopy);
                Inc(DestIdx, LCharsToCopy);
              end;
            end;
            Move(LPNewPattern^, LPResult[DestIdx], LenNP * SizeOf(Char));
            Inc(DestIdx, LenNP);
            Inc(SourceIdx, LenOP);
          end;

        LCharsToCopy := LenS - SourceIdx;
        if LCharsToCopy > 0 then
          Move(LPSource[SourceIdx], LPResult[DestIdx], LCharsToCopy * SizeOf(Char));
      end;
    end
    else
      Result := Source;
  end;
end;



Хотя скорее это завсить. Что я легко могу обходиться без всего этого хлама,и писать довольно гибкий код.

Функция SetLength не копирует строку в моём случае, а делает реллок - уменьщая длину.
28 сен 17, 23:38    [20830502]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
Няшик
Member

Откуда: Екатеринбург
Сообщений: 726
Эти функции плохи тем, что они гоняют одни и те же строки по много раз. И тормозят код во много. Мой же код, использует два цикла. Один, что бы прогнать основную строку, и второй - убрать лишние пробелы.

Просто - та кода. А у вас - дикий лес из тормозов.


Полезные ресурсы тратите попросту.
28 сен 17, 23:41    [20830506]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
Няшик
Member

Откуда: Екатеринбург
Сообщений: 726
К тому - же, времени я угрохал не больше 30 секунд на написания своего кода...

А вот в случае кода DimaBr, думаю столько - же. Только на + 10 и даже + 20 секунд дольше. Так как его код сложен в понимании. А мой лёгкий как при написании, так в чтении.
28 сен 17, 23:44    [20830513]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
Няшик
Member

Откуда: Екатеринбург
Сообщений: 726
Блин, сижу и в голову взбрело.
Сейчас же по налетите как мухи, и будите твердить
- быстрота кода не важна, для бизнес приложения.
- Грех не использовать что заложили в функционал среды - разработчики умнее

Это всё чистые предрассудки. Быстрота кода нужна - для быстрой сортировки, к примеру.

К тому - же, далеко не известно какое железо будет у пользователя. И на сколько под хламом прогибаться. Так что ваш код из pos и StringReplace может и пару минут работать на файлах в 100 тысяч строк.
28 сен 17, 23:48    [20830518]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
чччД
Guest
Няшик
Это вам, раз вы не можете без длинной функции Pos
...
Эти функции плохи тем, что они гоняют одни и те же строки по много раз.


Покажи в коде "плохой" функции Pos(). В каком именно месте там "гоняются строки по много раз".
29 сен 17, 00:00    [20830542]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
Няшик
Member

Откуда: Екатеринбург
Сообщений: 726
чччД
[
Покажи в коде "плохой" функции Pos(). В каком именно месте там "гоняются строки по много раз".


Давай подсчитаем.

Первый цикл
for i := 0 to SL.Count-1 do begin


В функции Pos идут уже два цикла repeat until
+
   repeat
        if PS[I] = LCh then
        begin
          J := 1;
          repeat
            if PS[I + J] = PSubStr[J] then
            begin
              Inc(J);
              if J = L then
                Exit(I + Offset);
            end
            else
              Break;
          until False;
        end;
        Inc(I);
      until I = LIterCnt;


Теперь, отбрасываем все проверки (Туча проверок! ДОХРЕНИЩЕ)
И смело считаем сколько раз нам надо потратить только тактов на функцию POS в обходе цикла for для длины SL.Count

(В частности, вы должны учесть - то, что мы не идём от строки к строке. Мы ещё режим саму строку - удаляя из неё лишние пробелмы, прежде чем перейти к следующей.)

+
  repeat
      j := Pos('  ',S);
      if j > 0 then S := StringReplace(S,'  ',' ',[rfReplaceAll]);
    until j = 0;



Осознаёшь сколько работает лишнего кода под капотом ? Не уважаю я такой код.
29 сен 17, 00:44    [20830577]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
white_nigger
Member

Откуда: Тула
Сообщений: 1537
Няшик
Не уважаю я такой код.
Смысла уважать код, который никак не решает задачу ТС, тоже нет
29 сен 17, 00:58    [20830587]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
Няшик
Member

Откуда: Екатеринбург
Сообщений: 726
white_nigger
Няшик
Не уважаю я такой код.
Смысла уважать код, который никак не решает задачу ТС, тоже нет


Кто сказал что не решает?

+
Картинка с другого сайта.
29 сен 17, 01:13    [20830597]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
Няшик
Member

Откуда: Екатеринбург
Сообщений: 726
Вот прямая ссылка на картинку
http://www.fotolink.su/pic_b/4304d4bd6ad9fd1e130e29e8973c742e.png
29 сен 17, 01:15    [20830599]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
crossa
Member

Откуда:
Сообщений: 49
Няшик,

Ваш код быстрее и эффективнее, не о чем тут спорить.
Надо присвоить значение переменной b в начале функции Skip:
b := False;
29 сен 17, 01:15    [20830600]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
Няшик
Member

Откуда: Екатеринбург
Сообщений: 726
crossa,

Да, действительно. Для лазура бы это было актуально. Но для Delphi они по умолчанию в false встаёт, по этому у меня не было в мыслях написать это условие.


Хотя если я не прав, и при каких - то условиях вместо false компилятор Delphi может выделить true, то поправьте.
29 сен 17, 01:18    [20830601]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
чччД
Guest
Няшик
чччД
[
Покажи в коде "плохой" функции Pos(). В каком именно месте там "гоняются строки по много раз".


Давай подсчитаем.

Первый цикл
for i := 0 to SL.Count-1 do begin


В функции Pos идут уже два цикла repeat until
+
   repeat
        if PS[I] = LCh then
        begin
          J := 1;
          repeat
            if PS[I + J] = PSubStr[J] then
            begin
              Inc(J);
              if J = L then
                Exit(I + Offset);
            end
            else
              Break;
          until False;
        end;
        Inc(I);
      until I = LIterCnt;


...


В каком конкретно месте "гоняются строки по много раз". Покажи. Хотя бы одну-единственную строчку.
29 сен 17, 01:31    [20830608]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
чччД
Guest
Няшик
...Но для Delphi они по умолчанию в false встаёт...

Локальные переменные будут тебе инициализироваться, ага.

Точно Лошарик.
29 сен 17, 01:33    [20830609]     Ответить | Цитировать Сообщить модератору
 Re: Форматирование текста  [new]
Няшик
Member

Откуда: Екатеринбург
Сообщений: 726
чччД
Няшик
пропущено...


Давай подсчитаем.

Первый цикл
for i := 0 to SL.Count-1 do begin


В функции Pos идут уже два цикла repeat until
+
   repeat
        if PS[I] = LCh then
        begin
          J := 1;
          repeat
            if PS[I + J] = PSubStr[J] then
            begin
              Inc(J);
              if J = L then
                Exit(I + Offset);
            end
            else
              Break;
          until False;
        end;
        Inc(I);
      until I = LIterCnt;


...


В каком конкретно месте "гоняются строки по много раз". Покажи. Хотя бы одну-единственную строчку.


Да ты просто издеваешься - понимая что код тот очень тормознутый. И меня просто зассрать хочешь - ох делать тебе нефиг. Я ведь показал как обойтись без гадости этакой.

чччД
Няшик
...Но для Delphi они по умолчанию в false встаёт...

Локальные переменные будут тебе инициализироваться, ага.

Точно Лошарик.



Вечно меня тут оскорбляешь. Хотя сам и пальцем не пошевелил. Жена в постельке не даёт? Ох бедненький, ну хорошо что я могу помочь тебе хоть как то неновисть выместить. Крепись там.

Да, я провёл аналогию. Первая переменная bool всегда в false. На неё прямой адрес стоит, дебагер показал
004D89A0 40               inc eax


Все остальные идут уже через смещения ebp
29 сен 17, 01:44    [20830616]     Ответить | Цитировать Сообщить модератору
Топик располагается на нескольких страницах: [1] 2 3   вперед  Ctrl      все
Все форумы / Delphi Ответить